Gene GM21_2002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2002
Symbol
ID	8137336
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2322626
End bp	2323693
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	64%
IMG OID	644869615
Product	cobalamin (vitamin B12) biosynthesis CbiM protein
Protein accession	YP_003021812
Protein GI	253700623
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0310] ABC-type Co2+ transport system, permease component
TIGRFAM ID	[TIGR00123] cobalamin biosynthesis protein CbiM

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	1.3837300000000002e-24
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCACATGG CGGACGCTTT GCTTTCCCCG GCGGTGGGAG GGACCATGTG GGCGGTCTCG 
GCAGGGACAA TCGCCCTTAG TTCCGCCCGC CTGCGCCGGG AGCAGGACGA CCGCCAGGCG 
CCTCTGATGG GTGTGCTGGG AGCCTTCCTT TTCGCCGCGC AGATGATCAA CTTCTCCATA 
CCCGGCACCG GTTCCAGCGG ACACTTAAGC GGCGGTTTGC TGCTGGCGGT ACTGCTCGGC 
CCTTCGGCCT CCTTCCTGAC CCTCGCCTCG GTGCTGGTAG TGCAGGCTCT GTTCTTTGCC 
GACGGAGGGC TCCTCGCTCT TGGCTGCAAC ATCTTCAACC TGGGCGTCAT CCCATCCTTT 
CTGGTCTACC CGTTCTTGTA CCGCATCCTC TCGAAGGGGG ACAGGCACCT TGCGGAGCCG 
GTCCCCGGCG GCACGCCTGG TAATTTGCGG GAAACCGCGG CCGTCATGGT AGCCACGCTG 
GTGGCCATGC AGCTAGGCTC CCTGGCCGTC GTGCTGGAAA CCGGTTTTTC GGGTATCTCT 
TCGCTTCCTC TGGAGCGTTT CCTGTTGTTG ATGCAGCCCA TACATCTCGC CATCGGAGCG 
GTCGAGGGGG CGGTGACAGT CGCCATCCTT TCCTTCGTGC GCAAGGCGCG CCCGGAACTG 
TTGCAGCGTG ATCAGGCTGG TAATGTCGGA CGCTCCCGCT TCGCGGTTTT GCTCGCCTTC 
CTGGTCCTCA CCCTGGTCAC CGGCGGCCTC CTTTCCCCGT TGGCTTCCAA AAACCCCGAC 
GGGCTGGAAT GGTCGCTCTC CAAAGTGGGT GGCGACGCGG TCGTTCCCGG TGCGGGAGAG 
GGGATGCACG GTCTTCTCGC TCACCTGCAG GAAAAAAGCG CATGGTTCCC CGATTACGTC 
GTGAAGCGTG CCGCGCCCCG TCCGCTGCCA AACGGTGCCG TCGATCTGCC TGCTGCCGCG 
AGCGCCGTTC CGGGAGTAGT CGGCACCCTC CTCACCCTTG CCCTTATCTG CGTCGCCGGG 
GCGCTGTTGA AGAGAGGAAA GCAAAGGGCG GATATACCCG ATGCCTGA

Protein sequence

MHMADALLSP AVGGTMWAVS AGTIALSSAR LRREQDDRQA PLMGVLGAFL FAAQMINFSI 
PGTGSSGHLS GGLLLAVLLG PSASFLTLAS VLVVQALFFA DGGLLALGCN IFNLGVIPSF 
LVYPFLYRIL SKGDRHLAEP VPGGTPGNLR ETAAVMVATL VAMQLGSLAV VLETGFSGIS 
SLPLERFLLL MQPIHLAIGA VEGAVTVAIL SFVRKARPEL LQRDQAGNVG RSRFAVLLAF 
LVLTLVTGGL LSPLASKNPD GLEWSLSKVG GDAVVPGAGE GMHGLLAHLQ EKSAWFPDYV 
VKRAAPRPLP NGAVDLPAAA SAVPGVVGTL LTLALICVAG ALLKRGKQRA DIPDA