Gene Tmz1t_3740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_3740
Symbol	cbiD
ID	7873738
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	4110578
End bp	4111744
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	73%
IMG OID	643700685
Product	cobalt-precorrin-6A synthase
Protein accession	YP_002890709
Protein GI	237654395
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1903] Cobalamin biosynthesis protein CbiD
TIGRFAM ID	[TIGR00312] cobalamin biosynthesis protein CbiD

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.72099
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGCAG GACATTCCCT CCCCGACAAG GTGCGCAAGG GCGACGCCAG GCGCTCGCGC 
GGCAATCGTA CCGGCTTCAC CACCGGCGCC AACTCGGCCG CGGCCGCGGC GGCCGCCACG 
CTCGGCCTGG TGCGCGGCGC GGTGCCCGAC GCGGTGGAGT GCGTGCTGCC CAACACGACG 
CGGGTGCGCT TCACGATCCG CGACGGCCAG GTGGACGGCG ACCACGCCCA CGCGGTCTCG 
ATCAAGGACG CCGGCGACGA TCCCGATGCC ACCCATGGCG CCCGTCTCAC CGCCGACGTG 
CGCCGCATCC GCGGGGGCGG CGGCGTGGTG ATCCTCGCGG GCGGCCCTGG CGTGGGCGTG 
GTCACCAAGC CCGGGCTCGG GCTGGCGGTC GGCGGCCCCG CGATCAACCC CGTGCCGCGG 
CGCAACATCA TCGACAACGT GCGCGCGGCC GGCACGCCCA TCCTCGAGGC CGGCGACGGT 
CTGGAGGTGA CGATCTCGGT GCCCGGCGGC GAGGAGATTG CGCGGAAGAC GCTCAATGCC 
CGCCTCGGCA TCCTCGGCGG CATCAGCATC CTCGGCACCA CCGGCATCGT CCGCCCGTAT 
TCCACCGCCG CCTTCCGCGC CAGCGTGATC CAGGCCATCG ATGTCGCCGC CAACCAGGGC 
CAGACCTGCG TGGTGTTCAC CACCGGTGGG CGCACCGAGA AATGCGCGAT GCGCGCCTTC 
CCGGACCTCG ACGAGGCCTG CTTCGTGCAG ATGGGCGACT TCGTCAAGGC CGCCTTCACC 
ACCGCGGTGA GGCAGGGCAT GCGCCACATC GTCGTCGGCG CCATGATCGG CAAGCTCACC 
AAGATCGCCC AGGGCCTGTC GGTCACCCAC GCCTGGCGCG AGGAGGTCGA TCGCGAGCTG 
ATCGCCGCCG CCGCTGCCGA GGTCGGCGCG CCGCCCGCGC TCGTGGCCGA GATCCGCGCC 
GCCGAGACCG CCCGCTTCGC CGCCGAACGC CTGAGCGCGC TCGGCCTGGC CGTGGCCTTC 
CACCGCGCGC TCGCCGGGCG CGCCATCCGC AGCCTGCGCC AGCGCTACCC CGGCCCGCAC 
CGGCTCACCG TGCTGGCGTG CAACTTCGAG GGCGTGCCGA TCGTGAGCGT CGATGAGGCC 
GACCTGAAGG AGACCACGCA TGCCTGA

Protein sequence

MAAGHSLPDK VRKGDARRSR GNRTGFTTGA NSAAAAAAAT LGLVRGAVPD AVECVLPNTT 
RVRFTIRDGQ VDGDHAHAVS IKDAGDDPDA THGARLTADV RRIRGGGGVV ILAGGPGVGV 
VTKPGLGLAV GGPAINPVPR RNIIDNVRAA GTPILEAGDG LEVTISVPGG EEIARKTLNA 
RLGILGGISI LGTTGIVRPY STAAFRASVI QAIDVAANQG QTCVVFTTGG RTEKCAMRAF 
PDLDEACFVQ MGDFVKAAFT TAVRQGMRHI VVGAMIGKLT KIAQGLSVTH AWREEVDREL 
IAAAAAEVGA PPALVAEIRA AETARFAAER LSALGLAVAF HRALAGRAIR SLRQRYPGPH 
RLTVLACNFE GVPIVSVDEA DLKETTHA