Gene Gdia_3230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3230
Symbol
ID	6976669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	3538525
End bp	3539565
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	66%
IMG OID	643392741
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_002277573
Protein GI	209545344
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.282549
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.671349
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGTTG CCCTCGTCCT CGAACGCAAG GACGTCCTGT CCTTGCGCGA CATCGACATT 
CCCCAGACGC TGGGTCCCCG CGACGTCAGA GTGAAAATCG ACACTGTCGG CATCTGCGGC 
AGCGACGTGC ATTATTATAC CCATGGCCGG ATCGGCCACT TCGTGGTCGA GAAACCGATG 
GTGCTGGGCC ACGAGGCATC GGGCACCGTG GTCGAGCTCG GCACGGCCGT CACGAACCTG 
AAAGTCGGCG ACCGGGTCTG CATGGAACCG GGTATCCCCG ATCCCACCTC GCGCGCATCG 
AAGCTCGGCA TCTACAATGT CGATCCCGCC GTCTCGTTCT GGGCGACGCC GCCGGTGCAT 
GGCTGCCTCA CCCCTCTGGT GGTGCATCCC GCCGCCTTCA CCTATCGCCT GCCGGACACC 
GTCAGCTTTG CCGAAGGCGC CATGGTCGAA CCGTTTGCGA TCGGCGTGCA GGCGGCCGTG 
AAGGCGAAGA TCAAGCCTGG CGATACCTGT GTGGTGACCG GATGCGGGCC GATCGGAATC 
ATGGTGGCGC TGGCGGCCCT CGGCGCGGGC GCGGGCAAGG TCATCGTGTC GGACATCGCC 
GCGCCGAAGC TGGATATCGC GGGCCGGTAT GCCGGCATCA TCCCGGTCGA TGTCGCGCGG 
GATTCGCTGC GCGACGCCGT GCGGGCGGAA TGCGGCGAGG GCTGGGGCGC GGACGTGGTG 
TTCGAGGCCA GCGGCAGTCC GCGCGTCTAT GACGATGCGC TGGCCGTCGT GCGGCCCGGC 
GGCACGCTGG TGCTGGTGGG CATGCCGGTC GACAAGGTGT CGTTCGATAT CGTTGCCGCC 
CAGGCCAAGG AAATTACGAT CGAGACCGTA TTCCGCTACG CCAATGTATA CGACCGGGCG 
ATCGCGCTGA TTGCTTCCGG CAAGGTCGAT CTCAAGCCGC TGATCTCGGG AACCTACAAC 
TTCGCGGATG CGGTCGAGGC ATTCGAACGG GCGGCGTCCG CCCGGCCCGG GGACGTCAAG 
TTGCAGATCC GCATGGCGTA G

Protein sequence

MPVALVLERK DVLSLRDIDI PQTLGPRDVR VKIDTVGICG SDVHYYTHGR IGHFVVEKPM 
VLGHEASGTV VELGTAVTNL KVGDRVCMEP GIPDPTSRAS KLGIYNVDPA VSFWATPPVH 
GCLTPLVVHP AAFTYRLPDT VSFAEGAMVE PFAIGVQAAV KAKIKPGDTC VVTGCGPIGI 
MVALAALGAG AGKVIVSDIA APKLDIAGRY AGIIPVDVAR DSLRDAVRAE CGEGWGADVV 
FEASGSPRVY DDALAVVRPG GTLVLVGMPV DKVSFDIVAA QAKEITIETV FRYANVYDRA 
IALIASGKVD LKPLISGTYN FADAVEAFER AASARPGDVK LQIRMA