Gene GM21_0400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0400
Symbol
ID	8135708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	475395
End bp	476453
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	62%
IMG OID	644868018
Product	Alcohol dehydrogenase zinc-binding domain protein
Protein accession	YP_003020239
Protein GI	253699050
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	73
Fosmid unclonability p-value	0.654367
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAACG CCAAAGCCTA CTCCGCTGCC AGCGCCACTT CGCCGCTGGC TTCGACCACC 
ATCCCCCGCC GCGAACCGAC CGAGCGCGAC GTGCAGATCG AGATCCTTTT TTGCGGCATC 
TGCCACTCCG ACCTGCACTC CGTGCGTAAC GAGTGGAGCA GCGTCATGCC GACGATCTAC 
CCCATTGTTC CCGGCCACGA AATAGTCGGA CGTGTAACAA AGGTCGGATC CGCGGTCACC 
AATTTCAAAC CGGGCGACCT GGCGGGGGTC GGCTGCCTGG TCGATTCGGA CCAAAGCTGC 
CCCCATTGCC ACGATGATCT TGAGCAGTTA TGCCCGAACC AGACCCTCAC CTTCAACTCG 
CCCGACAAAC ACCTCGGGGG CGTCACCTAC GGCGGCTACT CCGAGAGCAT CGTGGTGGAC 
GAACACTTCG TACTGCACGT TCCGGAGAAC CTGGAACTCG CCGGTGTCGC GCCCTTGCTC 
TGCGCGGGGA TCACTACCTA CTCCCCGATA CACCGCTGGG GCGACATCAA GGGCAAAAAG 
GTCGGCATCA TCGGCCTGGG CGGCCTGGGT CACATGGGGG TCAAGTTCGC CCGCGCCTTC 
GGAGCCCGGG TCGTCGTCTT CACCACCTCG CCCGGAAAGA GAGAGGATGC GCTGCGTCTG 
GGGGCGGACG AAGTCATCGT TTCCACCAAC GCCCAAGAGA TGCTGCTGCA CGCCGGGAGT 
TTCGATTTCA TCCTCGACAC CATCGCCGCC GATCACGACA TCAACGCATA CCTGAACATG 
CTCGCCCACG ACGGCAACCT CACCCTGGTA GGTGCGCCGG AGAAGCCTCT CGCCGTCTCC 
GCCTTCGCCC TTCTCTTCGG TCGCCGCAGC CTCTCCGGCT CCATCATCGG CGGCATCAAG 
GAGACCCAGG AGATGCTCGA TTTCTGCGGC GCGCACAACA TCACCGCCGA CGTGGAGGTC 
ATCCCCATTC AAAAAGTAAA CGAGGCCTAC GAGCGGCTGC TCAAGTCCGA TGTGAAGTAC 
CGCTTCTCCA TCGACATGGC TTCGCTCAAA GCCGAATAA

Protein sequence

MPNAKAYSAA SATSPLASTT IPRREPTERD VQIEILFCGI CHSDLHSVRN EWSSVMPTIY 
PIVPGHEIVG RVTKVGSAVT NFKPGDLAGV GCLVDSDQSC PHCHDDLEQL CPNQTLTFNS 
PDKHLGGVTY GGYSESIVVD EHFVLHVPEN LELAGVAPLL CAGITTYSPI HRWGDIKGKK 
VGIIGLGGLG HMGVKFARAF GARVVVFTTS PGKREDALRL GADEVIVSTN AQEMLLHAGS 
FDFILDTIAA DHDINAYLNM LAHDGNLTLV GAPEKPLAVS AFALLFGRRS LSGSIIGGIK 
ETQEMLDFCG AHNITADVEV IPIQKVNEAY ERLLKSDVKY RFSIDMASLK AE