Gene Sare_2704 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2704
Symbol	cbiD
ID	5707724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3077951
End bp	3079093
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	76%
IMG OID	641272162
Product	cobalt-precorrin-6A synthase
Protein accession	YP_001537532
Protein GI	159038279
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1903] Cobalamin biosynthesis protein CbiD
TIGRFAM ID	[TIGR00312] cobalamin biosynthesis protein CbiD

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.197164
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000132557
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGATACG ACCTGCCGCC GCTGCGCGAG CCGGACCTCC CGCGTACCGC GAAGGTCCGG 
CCCGTCGCGC TGCGCACCGG CTGGACCACC GGCGCCTGCG CCACGGCCGC GGCGAAGGCC 
GCGTTGACGG CGCTGGTGAC CGGTGTGGCA CCGGCGGAGG TCGAGATCGG ACTGCCGGCC 
GGGCGGCGGG TGCGCTTCCC GGTGGCCCGC TGCGACCGCA GGGACGAGGG CGCCGAGGCG 
GTGGTGGTCA AGGACGCCGG CGACGACCCG GACGTCACCC ACGGTGCGGA GCTGACCGCC 
ACCGTCGGCT GGCGGCCGGT GCCCGGGCTG GCCCTGGAGG GCGGGCCCGG GGTCGGCACG 
GTGACCAAGC CGGGGCTGGG ACTGGCGGTC GGCGGACCGG CGATCAACGA CACTCCGCGC 
CGGATGATCG GTGAGGCGGT CGCCGAGGTG GTTGACCTGA CCGCCGTCGG CGTTCGGGTG 
GTGATCAGCG TCCCCCGCGG GGAGATCATG GCCCGCAAGA CCACGAACCG CCGGCTCGGC 
ATCGTCGGGG GCATCTCGAT CCTGGGTACG ACGGGCATCG TCCGACCGTT CTCCACCGCG 
TCCTGGCGGG CCAGCGTCGT GCAGGCGGTG CAGGTGGCGG CCGCCCAGGG GGAACGCACG 
GTGGTGCTGT GCACGGGTGG GCGCACCGAG CGGGGCGCCC GGGCGCTGTT GCCGGAACTG 
CCGGAGGTGT GCTTTGTGGA GGTCGGCGAC TTCACGGGGG CGGCGGTCAC GGCCGCGGTC 
ACCCACGGCC TGTCCGGGGT GGCCTTCGTC GGCATGGCCG GCAAGCTGGC CAAGCTCGCC 
GCCGGGGTGC TGATGACCCA CTACACCCGC TCGAAGGTCG ACCTGTCGCT CCTCGGCGCC 
GTCACTGCCG AGGCGGGTGG CACCGCCGAC CTGGCCACCG CCGTCACCGC CGCCAACACC 
GGTCGGCACG CGTACGAGTT GTGGGAGGCC GCCGGCCTGC TCGGCCCGGC CGGCGACCTG 
CTCTGCAGCC GGGTCCGGGC GGTGCTGCGG CGCTTCGCCG GGGATGCCGT CGCCGTCGAC 
GTGGCCATGG TCGACTTCAC CGGGGCGCGG GTGGTCGCCT CCTCCGGGCG GTGGGCCCGG 
TGA

Protein sequence

MGYDLPPLRE PDLPRTAKVR PVALRTGWTT GACATAAAKA ALTALVTGVA PAEVEIGLPA 
GRRVRFPVAR CDRRDEGAEA VVVKDAGDDP DVTHGAELTA TVGWRPVPGL ALEGGPGVGT 
VTKPGLGLAV GGPAINDTPR RMIGEAVAEV VDLTAVGVRV VISVPRGEIM ARKTTNRRLG 
IVGGISILGT TGIVRPFSTA SWRASVVQAV QVAAAQGERT VVLCTGGRTE RGARALLPEL 
PEVCFVEVGD FTGAAVTAAV THGLSGVAFV GMAGKLAKLA AGVLMTHYTR SKVDLSLLGA 
VTAEAGGTAD LATAVTAANT GRHAYELWEA AGLLGPAGDL LCSRVRAVLR RFAGDAVAVD 
VAMVDFTGAR VVASSGRWAR