Gene GM21_3403 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3403
Symbol
ID	8138770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	3934558
End bp	3935568
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	61%
IMG OID	644871020
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_003023185
Protein GI	253701996
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	137
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAAGA TACTGGTTAC CGGCGCTGCA GGATTCATCG GATTTCATCT CTCGGAAAAG 
CTCCTCGCCA AGGGGTGCGA GGTGGTCGGC CTGGACAACT TGAACGACTA TTACGAGGTC 
GCCCTCAAGG AGGGGAGGCT CTCCCGGCTG GAGGGAAAGC CGGGCTTTCG TTTCGCGCGC 
ATGAACCTGG AGGACCGCGA GGGGATCAAG GAACTCTTCG CCGCCGAGAA GTTCGACTCC 
GTGGTGAACC TGGCCGCGCA AGCCGGGGTC CGCTACTCGA TCGAAAACCC TTACGTCTAC 
ATCGACAGCA ACCTCTCCGG TTTCATCAAC ATCCTGGAGG GGTGCCGCCA CAACAAGGTG 
GGACACCTGG TCTACGCCTC CTCATCCTCG GTATACGGCG CCAACACCAC CATGCCTTTT 
TCGGTGCACC ACAACGTGGA CCATCCCGTC TCGCTCTACG CCGCCACCAA GAAGGCCAAC 
GAGCTGATGG CGCACACCTA TTCCAGCCTC TACGGGCTCC CCACCACGGG GCTGCGCTTT 
TTCACCGTAT ATGGGCCTTG GGGGCGCCCC GACATGGCGC TCTTTCTCTT CACCAAGGCG 
ATCCTAGAGG GGAAACCGAT CGACGTCTTC AACTACGGGA AGATGCAGCG CGACTTCACC 
TTCATCGACG ACATCGTGGA AGGTGTCGCC CGCGTGATCG ACAGCGTCCC CGCAGGCGAC 
CCCGGCTGGA GCGGCGCGAA CCCCGATCCG GGAACGAGCT ATGCCCCTTA CAAGATCTAC 
AACATCGGCA ACAACAACCC GGTGGAGCTT ATGCGCTTCA TCGAGGTGCT GGAAAAGGCG 
CTGGGGAAAG AGGCGCAGAA GAACCTGCTC CCGATTCAGG CCGGCGACGT CCCGGCGACC 
TACGCCGACG TCGACGACCT GATGCGGGAC GTCGGCTTCA AGCCGGCCAC CTCCATCGAG 
GACGGGATCG CGCGCTTCGT CGCCTGGTAC CGCGATTTCT ACAAGGTTTG A

Protein sequence

MAKILVTGAA GFIGFHLSEK LLAKGCEVVG LDNLNDYYEV ALKEGRLSRL EGKPGFRFAR 
MNLEDREGIK ELFAAEKFDS VVNLAAQAGV RYSIENPYVY IDSNLSGFIN ILEGCRHNKV 
GHLVYASSSS VYGANTTMPF SVHHNVDHPV SLYAATKKAN ELMAHTYSSL YGLPTTGLRF 
FTVYGPWGRP DMALFLFTKA ILEGKPIDVF NYGKMQRDFT FIDDIVEGVA RVIDSVPAGD 
PGWSGANPDP GTSYAPYKIY NIGNNNPVEL MRFIEVLEKA LGKEAQKNLL PIQAGDVPAT 
YADVDDLMRD VGFKPATSIE DGIARFVAWY RDFYKV