Gene Avin_38720 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_38720
Symbol	truD
ID	7762761
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	3916494
End bp	3917552
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	69%
IMG OID	643806735
Product	tRNA pseudouridine synthase D
Protein accession	YP_002800987
Protein GI	226945914
COG category	[S] Function unknown
COG ID	[COG0585] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00094] tRNA pseudouridine synthase, TruD family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.711816
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAGT CCGAACTGCT CGGTCCCAGG GCATATGGCG AAGCCTGCGG CCAGGCACTG 
CTCAAGGCCT GCGCCGAGGA CTTCCAGGTC GACGAGGTGC TGGACATTCC CCTGAGTGGG 
CAGGGCGAGC ATCTCTGGTT GTGGGTGGAA AAGCGCGGGC TGAATACCGA GGAGGCGGCT 
CGGCGCCTGG CCCGTGCCGC CGGGATGCCG CTGAAGGCGA TCAGCTATGC CGGTCTGAAG 
GATCGCCAGG CGCTGACCCG CCAGTGGTTC AGCCTGCACC TGCCGGGCAA GGCCGATCCC 
GACCTCGTGG CCGCGGAGGA CGACAGCCTG CGTATCCTCG AGCGTGTCCG CCACTCGCGG 
AAACTGCAAC GTGGTGCCCA CGCGGCCAAC GGTTTCAAGC TGCGGCTGAC TCGCCTCGCC 
GCCGATCGTC CGGCGCTGGA TGCGCGTCTG GAGCAGCTCC GCCGCCAAGG AGTGCCCAAC 
TACTTCGGCC TGCAGCGTTT CGGCCACGAC GGCGGCAATC TCGCCGAGGC CAGGGCCTTC 
GCCGTGCGGC GGGAACTGCC TGCGCAACGC AACCTGCGCT CGCGTCTGCT CTCGGCAGCG 
CGCAGCTATC TGTTCAACCG GGTGCTGGCC GAGCGGGTCG CGGTAGGCGA CTGGAATCGG 
GCGCAGCCGG GAGACCTGCT GGCTTTCACC GACAGCCGCA GTTTCTTCCC GGCGGGCGTG 
GAGGAGTGCG CCGACCCGCG CCTGGCACTG CTCGACCTGC ATCCCACCGG CCCGCTCTGG 
GGCGCGGGCG GCTCCCCGGC CGGCGCGGCG ACCAAGGTGC TGGAGGATGC CGTCGGCCGG 
TGCGAGGCGC CACTCGGCGA CTGGCTGGGG GAAGCGGGCA TGCTGCACGA ACGGCGCATC 
CTGCGCCTCC CCATCGACCG GCTGGCGTGG CATTATCCCG CCATCGACAT CTTGCAACTG 
GAATTCGTCC TGCCGGCCGG CTGCTTCGCC ACTGTCGTGG TCCGCGAGCT CGTCGATCTG 
TGGCCGGCAG GCTTAATGGA CACTTCATGC GTATTCTGA

Protein sequence

MSESELLGPR AYGEACGQAL LKACAEDFQV DEVLDIPLSG QGEHLWLWVE KRGLNTEEAA 
RRLARAAGMP LKAISYAGLK DRQALTRQWF SLHLPGKADP DLVAAEDDSL RILERVRHSR 
KLQRGAHAAN GFKLRLTRLA ADRPALDARL EQLRRQGVPN YFGLQRFGHD GGNLAEARAF 
AVRRELPAQR NLRSRLLSAA RSYLFNRVLA ERVAVGDWNR AQPGDLLAFT DSRSFFPAGV 
EECADPRLAL LDLHPTGPLW GAGGSPAGAA TKVLEDAVGR CEAPLGDWLG EAGMLHERRI 
LRLPIDRLAW HYPAIDILQL EFVLPAGCFA TVVVRELVDL WPAGLMDTSC VF