Gene GM21_2538 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2538
Symbol
ID	8137880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	2966644
End bp	2967765
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	66%
IMG OID	644870147
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_003022337
Protein GI	253701148
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.00000014544
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCAGGGA GCGTTCTAAT CACAGGGGGA GCCGGATTCA TTGGATCTCA CCTGGCAGAT 
GAGCTTCTTC GTCACGGTTA CCGCGTCCGC GTTCTGGACA GTCTGGTGCC GCAGGTTCAT 
GGACCGGATG GGAACCGACC CGGCTACCTG GATCCGGAGG TCGAACTGAT CAAGGGGGAC 
GTGCGGGACC AGGCCGCCGT GCAGCGGGCT TTGGCCGGGA CCGAGGCGGT GTTCCACCTG 
GCCGCCATGG TTGGCGTGGG GCAGAGCATG TACGAGATCG AGCAGTACAC CTCGGTCAAC 
AACTGCGGCA CCGCCGCGCT CCTGGAGGCG ATGGCTCACG CCAAGGGGCA TCGCAAGCTG 
ATCGTCGCCT CCAGCATGAG CATCTACGGC GAGGGGCGCT ACCGCGACGC CGACGGGCTT 
TGCTACGACG ACGTCAGGCG CCCCCTGGAG CAGTTGCAGC GTGGGCGCTG GGAGCCGTTC 
AACCGCAGGA GCGAGCCGCT GCGCCCGGTG GCGACGCCCG AGGACAAGTC GCCGTCGCTT 
GCCTCGGTCT ACGCCCTTTC CAAGTACGAC CAGGAGCGTA TGGCGCTCAT CGTCGGGGAG 
TGTTACCGCA TCCCGGTGAT CGCGCTGCGC TTTTTCAACG TCTACGGCAC CAGGCAGGCG 
CTCTCCAACC CCTACACCGG GGTGCTCGCC ATCTTCGCCT CCAGGCTCAT GAACGGCAAC 
CCGCCTCGCA TCTACGAGGA CGGGTTGCAG CAGCGCGACT TCGTCAGCGT GCACGACGTG 
GTGACCGCCT GCCGCCTGGC GCTTCAGGTG GACCAGCGGC AGGCGCAACT CTTCAACATC 
GGCAGCGGCG CCAACATCAG CGTCCTCGAG GTGCTGCAGC GCTTCCGCCG TGTGCTCAAC 
TGCGACGGTA TCGAGCCGGA GATCACCGGC AACTACCGGG CCGGCGACAT CAGGCACTGC 
TTCGCCGACA TAAGCTCCGC CCGCTCCATC CTGGGATACG CCCCGAGGGT CTCCTTCGAC 
GAGGGGCTTG CCGAGCTGGC CGGCTGGCTG GAAGGGGAGG TCGCCATAGA CCGCGTCTCC 
GAGGCGCATG CCGAACTCAC CCAGCGGGGG TTGACGCTAT GA

Protein sequence

MAGSVLITGG AGFIGSHLAD ELLRHGYRVR VLDSLVPQVH GPDGNRPGYL DPEVELIKGD 
VRDQAAVQRA LAGTEAVFHL AAMVGVGQSM YEIEQYTSVN NCGTAALLEA MAHAKGHRKL 
IVASSMSIYG EGRYRDADGL CYDDVRRPLE QLQRGRWEPF NRRSEPLRPV ATPEDKSPSL 
ASVYALSKYD QERMALIVGE CYRIPVIALR FFNVYGTRQA LSNPYTGVLA IFASRLMNGN 
PPRIYEDGLQ QRDFVSVHDV VTACRLALQV DQRQAQLFNI GSGANISVLE VLQRFRRVLN 
CDGIEPEITG NYRAGDIRHC FADISSARSI LGYAPRVSFD EGLAELAGWL EGEVAIDRVS 
EAHAELTQRG LTL