Gene GM21_0122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0122
Symbol
ID	8135425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	154253
End bp	155458
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	64%
IMG OID	644867742
Product	Alcohol dehydrogenase GroES domain protein
Protein accession	YP_003019966
Protein GI	253698777
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	0.566245
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGCAG TATGCTGGCA TGGCAAGCAG GACGTTCGGG TGGACACCGT GCCCGACCCG 
GAGATCGTAC AGAAGGGGGA CGTCATCGTT AAAGTCGCCC TCACCTGCAT CTGCGGTTCC 
GACCTGCACC TTTACAACGG CTACGTCCCC ACCATGAAAA AGGGGGACAT CCTGGGGCAC 
GAGTTCGTCG GCGAGATCGT CGCGGCCGGC CCCGGCGTCT CCCGCTTCAG GGTCGGCGAC 
CGCGTCATCG TTCCGTTTCC GATCAGTTGC GGCGCGTGCT GGTACTGCAA GCACGAGCTC 
TGGTCGCTTT GCGACAACAC CAACCCGAAT TCCTGGATGA TGGAAAACAT CTACGGCGAC 
ACCGGCGGCG GGATCTTCGG CTACTCCCAT CTCTACGGAG GATATGCCGG CGGTCAGGCC 
GAGTACGTCC GGGTACCTTT CGCCGACGTG GGGCTAGAGA AGATACCGGA CGGGATACCG 
TACGAGCAGG TGGTGCTCTT AACCGACATC ATGCCCACCG GCTACCAGGC CGCAGTCTAC 
TGCAACATCA ACCCGGGCGA TACCGTCGCC GTCTGGGGGT GCGGGCCGGT GGGGCTCCTG 
GCCATGAAGT CGGCCAAGCT TCTGGGGGCC GAGCGGGTGA TCGGCATCGA CCGTTTCCCC 
GACCGGCTGC AGATGGCGCA CAGCCAGTGC CAGGCCGAGG TTATCAACTA CGAGGAGGTG 
GACGTGGCCG AGCAGCTGCA GAACATGACC GGCGGGCGCG GCCCCGATTC CTGCATCGAC 
GCGGTGGGGC TTGAGGCCCG CGGGACCGGC ATCGAGGACG TCTACGACCT GGTGAAGCAG 
ACGCTGCGCC TGGAAACCGA CCGTGCTTCC GCGCTGCGCC AGCTGGTGAG GGCGTGCCGC 
AAGGGGGGGA CCCTGTCCAT CTCGGGGGTC TACAGCGGGT TCATCGACAA GTTCCCCATG 
GGGGCCATCT TCGCCAAAGG GCTCACCGTG CGCGGAGGGC AGGCCCACGT GCACAAGTAC 
CTCCCCCACC TGGTGAAGCT GGTCGCGGAG CAGCAGATCG ATCCCTCCTG CATCATCACG 
CATTGGATCT CGCTGGAGGA GGCGCCTGCC GGCTACCGCA CCTTCCTGAA GAAGCAGGAT 
TCCTGCATCA AGATCGCCCT CAAACCGGAG CACGCCGCCC CGAAAAGCGA ACCCGCCTCA 
GCATGA

Protein sequence

MRAVCWHGKQ DVRVDTVPDP EIVQKGDVIV KVALTCICGS DLHLYNGYVP TMKKGDILGH 
EFVGEIVAAG PGVSRFRVGD RVIVPFPISC GACWYCKHEL WSLCDNTNPN SWMMENIYGD 
TGGGIFGYSH LYGGYAGGQA EYVRVPFADV GLEKIPDGIP YEQVVLLTDI MPTGYQAAVY 
CNINPGDTVA VWGCGPVGLL AMKSAKLLGA ERVIGIDRFP DRLQMAHSQC QAEVINYEEV 
DVAEQLQNMT GGRGPDSCID AVGLEARGTG IEDVYDLVKQ TLRLETDRAS ALRQLVRACR 
KGGTLSISGV YSGFIDKFPM GAIFAKGLTV RGGQAHVHKY LPHLVKLVAE QQIDPSCIIT 
HWISLEEAPA GYRTFLKKQD SCIKIALKPE HAAPKSEPAS A