Gene GM21_3610 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3610
Symbol
ID	8138983
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	4190825
End bp	4191895
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	65%
IMG OID	644871230
Product	cobalamin biosynthesis protein CbiD
Protein accession	YP_003023389
Protein GI	253702200
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1903] Cobalamin biosynthesis protein CbiD
TIGRFAM ID	[TIGR00312] cobalamin biosynthesis protein CbiD

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	124
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGA AAGAACTCAG ATACGGTTTC ACCACCGGGG CATGCGCCGC CGCCGCCGTC 
AAGGCGGCCG CCCAGATGCT GCGCGACCAG GCGATGGTTC GCGAGGTTGA ACTCATGCTT 
CCCTGCGGCA TCGGCGCGAA CTTCCAGGTC CACGGCGGGG TGTTGCGCGA CAACACGGCT 
TCGTGCTACG TCGTGAAGGA TGCCGGCGAC GACCCGGACG TGACCAACGG CGCCGAGATC 
CACGTCACCG CCAGCATCGA GTTCTTCACC AAGAACGAGA TAAAGATCGA GGGGGGGACC 
GGCATCGGCC GGGTCACCAA GCCGGGGCTC GCGGTCCCGG TGGGCGCGTG GGCGATAAAT 
CCGGTACCGC GCAGCATGAT CCTGGAAGTG GTGAAGGAGG TATTCGCGCT GCGCTGCATT 
CCGGCGACGC TCACCTTCAG CATCAGCATC CCCAACGGCG AGGAACTGGC GAAGAGGACC 
CTCAACGAGC GGCTCGGCAT CGTCGGCGGG CTCTCCATCC TCGGGACCAC CGGAATCGTC 
AAGCCGATCT CGGCCAAGGC CTGGACCGAC ACGGTGGACG CCTCGGTCGA CGTGGCTTTG 
GCCTGCGGCG CGCGTACCGT CGTCCTTGCC ACAGGGAGGA GTTCCGAGAT CGTGGCGCAG 
AAGCACCTTT CCCTGAGCGA GGAGGCCTTC GTCATGATGG GGGACCACTT CGGCTACGCG 
ATGCGGAGTT GCGCCAGCAA GGGGGTTCCG GAAGTCGTTG TCGCCGGGCA GTTCGCCAAG 
CTGGTGAAGA TCGCCTGCGG TCACGAGCAG ACCCACGTGA CCTCGTCCCA GATGGACCTG 
GATGCTCTGG CCTGGTGGCT GAGGGAGGTG CCGGCGACGG CGCACCTGGA GCAGATGGCG 
CGCGAGGCGA ACACGGCGCG ACACCTGCTT GAGGCGTCGG GGTACAACAA GGCCCTCATC 
GAACTGGTCT GCTCCCGTGT GCTCAAGGTC TGCGCCGATG TGGCGCCCTG GATGAAGGCG 
CGGGTGATGC TGGCGGGATA CCACGGCGAT CTTTTGTACT TTTCCCCGTA G

Protein sequence

MSGKELRYGF TTGACAAAAV KAAAQMLRDQ AMVREVELML PCGIGANFQV HGGVLRDNTA 
SCYVVKDAGD DPDVTNGAEI HVTASIEFFT KNEIKIEGGT GIGRVTKPGL AVPVGAWAIN 
PVPRSMILEV VKEVFALRCI PATLTFSISI PNGEELAKRT LNERLGIVGG LSILGTTGIV 
KPISAKAWTD TVDASVDVAL ACGARTVVLA TGRSSEIVAQ KHLSLSEEAF VMMGDHFGYA 
MRSCASKGVP EVVVAGQFAK LVKIACGHEQ THVTSSQMDL DALAWWLREV PATAHLEQMA 
REANTARHLL EASGYNKALI ELVCSRVLKV CADVAPWMKA RVMLAGYHGD LLYFSP