Gene Gdia_0720 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0720
Symbol
ID	6974117
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	817622
End bp	818650
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	66%
IMG OID	643390249
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_002275125
Protein GI	209542896
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.546912
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	0.597384
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGGAA AGATGAAGGC CGCTGTCGTT CGTGAGTTCG GCAAGCCGCT GACGATCGAA 
GAGCTGGATA TTCCCTCGAT CCGGCCGGAC CAGATCCTGG TCAAGATGGA CGCGTGCGGC 
GTCTGCCACA CCGACCTGCA CGCCGCCCGG GGGGACTGGC CCGTGAAGCC GAATCCGCCC 
TTCATCCCGG GGCACGAGGG CGTGGGCCAC GTCGTGTCCG TGGGCAGCGC GGTCAAATGG 
GTCAAGCTGG GCGATGTCGT CGGCGTGCCG TGGCTGTATT CGGCCTGCGG CCATTGCGAG 
CACTGCCTGG GCGGGTGGGA AACGCTGTGC GCCAGCCAGG ACGATACCGG CTACACCGTC 
AATGGCTGCT TCGCCGAATA TGTGGTGGCC GATCCCAGTT ACGTCGCCCA CCTGCCGAAG 
ACGATCGACC CGCTGCAGGT GGCGCCCGTG CTCTGTGCCG GCCTGACGGT CTACAAGGGC 
CTGAAGATGA CCGACACCAA GCCGGGTGAC TGGGTCGCGG TGTCGGGTGT CGGCGGGCTG 
GGCCAGATGG CGGTGCAATA CGGCGTCGCC ATGGGGATGA ACGTCATCGC CGTCGATATC 
GACGACGAAA AGCTGGCCAC GGCAAAGGCC CTGGGCGCGG CGCTGACGGT GAACGCGCGC 
GCCACCGATC CCGCCCCCTT CATCCAGTCG CAGGTCGGCG GCGCCCATGG CGCGCTGGTC 
ACGGCCGTGT CGCGCAGCGC GTTCTCGCAG GCGATGGGCT TTGCCCGCCG GGGCGGCACG 
ATCGTGCTGA ACGGGCTGCC GCCGGGGGAA TTCCCGATTT CCATCTTCGA CATGGTCATG 
GCCGGGACCA CGGTGCGCGG ATCGATCGTC GGCACGCGGC TGGACATGAT CGAGGCGGTG 
TCCTTCTTCG CCGACGGCAA GGTCAAGACG GTGATCGAGC CCGACCGGCT GGAAAACATC 
AACCAGATCT TCACCGACCT GGAAGAAGGC AAGATCCAGG GACGCAAGGT GCTGGATTTC 
CGCCAGTAA

Protein sequence

MTGKMKAAVV REFGKPLTIE ELDIPSIRPD QILVKMDACG VCHTDLHAAR GDWPVKPNPP 
FIPGHEGVGH VVSVGSAVKW VKLGDVVGVP WLYSACGHCE HCLGGWETLC ASQDDTGYTV 
NGCFAEYVVA DPSYVAHLPK TIDPLQVAPV LCAGLTVYKG LKMTDTKPGD WVAVSGVGGL 
GQMAVQYGVA MGMNVIAVDI DDEKLATAKA LGAALTVNAR ATDPAPFIQS QVGGAHGALV 
TAVSRSAFSQ AMGFARRGGT IVLNGLPPGE FPISIFDMVM AGTTVRGSIV GTRLDMIEAV 
SFFADGKVKT VIEPDRLENI NQIFTDLEEG KIQGRKVLDF RQ