Gene Gdia_1549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1549
Symbol
ID	6974959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	1727717
End bp	1728697
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	66%
IMG OID	643391080
Product	aldo/keto reductase
Protein accession	YP_002275943
Protein GI	209543714
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.886416
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.340196
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTACA CGCGCTTGGG CCGGACCGGC CTGCAGGTAT CGCGTATCTG CCTGGGCTGC 
ATGACCTATG GCGTGCCGGA ACGCGGCAAC CATCCCTGGA CGCTGGACGA GGAAACCAGC 
CGCCCGCTGA TCCGTCAGGC GCTGGACGCC GGGATCAATT TTCTCGATAC CGCCAATACC 
TATTCCGACG GCACGTCGGA GGAGATCGTC GGCCGCGCGA TCCGCGATTT CGCCCGGCGC 
GAGGAGATCG TGCTGGCCAC CAAGGTGTTC TTTCCGCAGC GCAAGGGCCC CAACGGGGGC 
GGTCTGTCGC GCAAGGCGAT CCTGGGCGAG ATCGACAACA GCCTGCGCCG CCTCGGTACC 
GATTACGTGG ACCTCTACCA GATCCATCGC TGGGACCCTG AAACGCCGAT CGAGGAAACG 
ATGGAGGCGT TGCATGACGT CGTGAAGGCG GGCAAGGCGC GCTATATCGG CGCGTCGTCC 
ATGTATGCGT GGCAGTTCGC CAAGGCGGTC TACACGTCGC GGCTCAACGG CTGGACGGAG 
TTCGTCAGCA TGCAGGACCA TCTGAACCTG CTGAACCGCG AGGAAGAGCG CGAAATGCTG 
CCCTTCTGCC GGGACCAGGG GATCGGCGTC CTGCCCTGGA GCCCGCTGGC GCGCGGGCGC 
CTGGCGCGGG ACGGGAACGA AAGCACCAGC CGGCAGGAAA CGGACAACTA CGCCAAAATC 
CTGTATGAAA AAACGGAAGA ATCGGATCGC GCCGTCATTG ATGCCGTCGG CCGGATCGCG 
GCGCAACGCG GCGTGCCGCG CGCCCAGGTC GCGCTGGCGT GGGTGCTCCA GACGCCGGGC 
GTGACGGCGC CGATCGTGGG GGCGTCGAAG CCCGGGCAAC TGGCCGACGC GGTCGGTGCG 
CTGTCCCTGA CCCTGACGGC GGAGGAGATC GCCGCCCTGG CAGCACCCTA TGTTCCGCAC 
CCGGTCGTGG GATTCGGCTA A

Protein sequence

MEYTRLGRTG LQVSRICLGC MTYGVPERGN HPWTLDEETS RPLIRQALDA GINFLDTANT 
YSDGTSEEIV GRAIRDFARR EEIVLATKVF FPQRKGPNGG GLSRKAILGE IDNSLRRLGT 
DYVDLYQIHR WDPETPIEET MEALHDVVKA GKARYIGASS MYAWQFAKAV YTSRLNGWTE 
FVSMQDHLNL LNREEEREML PFCRDQGIGV LPWSPLARGR LARDGNESTS RQETDNYAKI 
LYEKTEESDR AVIDAVGRIA AQRGVPRAQV ALAWVLQTPG VTAPIVGASK PGQLADAVGA 
LSLTLTAEEI AALAAPYVPH PVVGFG