Gene GM21_3606 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3606
Symbol
ID	8138979
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4186496
End bp	4187539
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	64%
IMG OID	644871226
Product	cobalamin (vitamin B12) biosynthesis CbiG protein
Protein accession	YP_003023385
Protein GI	253702196
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2073] Cobalamin biosynthesis protein CbiG
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	129
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAGTAG CGATCATCGC CATAACCGGC AACGGCGCCC GCCTGGGGAA AGTGCTGCAA 
GAGGGAATCC CCGATAGCCG GCTCTTCGTG ATCGAGAAGC ATGCCGGGCC TTCCTGCCAC 
CCGTTTTCGG AGCCGGTGCC GGCTTTGATC TCGCGCCTTT GGCCGGAATG CCGCGGGTTC 
ATCTGCATCA TGGCCACCGG GATCGTGGTC CGCTGCATCG CGCCGCTTCT GCAGGCCAAG 
GACCGGGACC CCGCGGTGGT GGTGCTCGAC GACGCAGGGA AGTTCGCGGT CTCGCTTCTG 
TCCGGCCATC TGGGAGGTGC CAATGCCCTC GCGAAAAGCT GCGCGTCCCT TACCGGATGC 
ACCCCCGTCG TCACCACTGC AACCGATGCC AACGACCTAC CCTCCTTCGA CCTGCTGGCG 
CAGGAGAACG GCTGGGTCAT CGACGACCTG TCGCGGGTGA AGGCGCTGAA CGCTCTTCTC 
CTTGAGGGAC GGGAGATCGC CGTGGCGGAC CCGACCGGTA GGGTGAGAAG GTACTGCGCG 
GGGAGGGGGA ACCTTGTTTT CGTGGCCGAT GCGGAAAAGG CCGCTGCCTC GGGTGCGGCC 
GGGTTGCTCC TGGTCACCAA TCGGACGCTT CCCTCCCCGC TCGATAGGCA ACGGACCCTG 
GTGCTGCGTC CGGTAAACCT TCATCTAGGC ATCGGCTGCA ACAGGGGCAC TGCCATGGAA 
GAGATCGAAG CGGTGGTCAT GGCGAACCTG GAACGGCTGG GTCTTTCCGT AAAGAGTGTC 
AAGTGCCTGG CTACGGCAAG GGCCAAGGAG GATGAGGAAG GGCTTCTGGC ATTCGCCGCG 
AGGCTGGGAG TGCCGCTTAT CTTTTTCGAC AACGAGGAGT TGAACGGCGT CGCCGTCCCC 
TCTCCCCCTT CGGCGCATGC CATGGCCGCC ATCGGCGCGC GCGGCGTCGC AGAACCGGCG 
GCGCTGCTGG CATCGGGGGG CGGGACGCTG ATCTTGAAGA AGGTGAAGGA CGGGAATGTC 
ACCCTGTCGA TAGCGCAGGG GTAA

Protein sequence

MQVAIIAITG NGARLGKVLQ EGIPDSRLFV IEKHAGPSCH PFSEPVPALI SRLWPECRGF 
ICIMATGIVV RCIAPLLQAK DRDPAVVVLD DAGKFAVSLL SGHLGGANAL AKSCASLTGC 
TPVVTTATDA NDLPSFDLLA QENGWVIDDL SRVKALNALL LEGREIAVAD PTGRVRRYCA 
GRGNLVFVAD AEKAAASGAA GLLLVTNRTL PSPLDRQRTL VLRPVNLHLG IGCNRGTAME 
EIEAVVMANL ERLGLSVKSV KCLATARAKE DEEGLLAFAA RLGVPLIFFD NEELNGVAVP 
SPPSAHAMAA IGARGVAEPA ALLASGGGTL ILKKVKDGNV TLSIAQG