Gene GM21_0884 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0884
Symbol
ID	8136205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	1053594
End bp	1054583
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	65%
IMG OID	644868500
Product	hopanoid-associated sugar epimerase
Protein accession	YP_003020709
Protein GI	253699520
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR03466] hopanoid-associated sugar epimerase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.0000000000222195
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAAGGCAT TCGTCACAGG CGCCACCGGG TTCATCGGCG CGAGCATCGT GCGCGAACTG 
TTGAAGGACG GCTGGGAGGT ACGGGTCTTG GCCCGGCCCG GCTCGGACCG TCGCAACCTC 
TCCGGGCTCG ACATAGAGAT CAGGGAAGGG GACCTGAGCG ACCGGGAGGC GCTGGTGCAG 
GCGCTCAGCG GCTGCCGGGC GCTGTTCCAC GCCGCCGCCG ATTATCGGCT CTGGACACCC 
ACGCCGGAGG CCATGTACGA TGTCAACGTC AAAGGGACCC GGGCGATACT GTCGGCGGCT 
CTCGCGGCGG GCATCGAGAA GGTGGTCTAC ACAAGCAGCG TCGGGACCCT GGGGAACCCC 
GGCGACGGCA CCCCCGGAGA CGAGAGCACA CCGGTGGACT TCCGCCACAT GGTGGGGGAC 
TACAAGAAGA GCAAGTTCCT CGCCGAGCGG GCGGCGGAGT CGTTCCTGGC AAAGGGGTTG 
CCGCTCGTGA TCGTGAACCC GTCGACCCCG GTGGGCCCGA TGGATGTGAA GCCTACGCCG 
ACGGGAAAGA TCATCGTCGA CTTCCTGAAC GGCCGGATGC CCGCCTACCT GGACACGGGG 
CTGAACCTGA TAGACGTGGA GGCTTGCGCG CGGGGGCATG TCCTGGCGGC GCGCAAGGGG 
CGGGTCGGGG AAAAGTACAT CCTTGGGAAC CGCAACCTGA CCCTGGCCGA GATATTCGAG 
ATGCTGTCCG GCATCACCGG GCTCAAGGCG CCGCGGGTGA AGCTCCCCTA CTATCCGATA 
CTTATGGCCG CATACGTGAA CCATGCGCTG TCGGCCGTGA CAGGGAAAGA GCCGCTGATA 
CCGCTTGCCG GCGTGCAGAT GGCGGCGAAG TTCATGTATT TCGATGCGGG GAAGGCGGTG 
AGCGAGTTGG GGTTGCCGCT CTCCCCCGTG GAAGGCGCGC TGGATCGCGC CGTACAGTGG 
TTCCGCAGCA ACGGCTACGT TAACCGATAA

Protein sequence

MKAFVTGATG FIGASIVREL LKDGWEVRVL ARPGSDRRNL SGLDIEIREG DLSDREALVQ 
ALSGCRALFH AAADYRLWTP TPEAMYDVNV KGTRAILSAA LAAGIEKVVY TSSVGTLGNP 
GDGTPGDEST PVDFRHMVGD YKKSKFLAER AAESFLAKGL PLVIVNPSTP VGPMDVKPTP 
TGKIIVDFLN GRMPAYLDTG LNLIDVEACA RGHVLAARKG RVGEKYILGN RNLTLAEIFE 
MLSGITGLKA PRVKLPYYPI LMAAYVNHAL SAVTGKEPLI PLAGVQMAAK FMYFDAGKAV 
SELGLPLSPV EGALDRAVQW FRSNGYVNR