Gene NATL1_00341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_00341
Symbol	cbiD
ID	4780273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	33942
End bp	35087
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	37%
IMG OID	640083297
Product	cobalt-precorrin-6A synthase
Protein accession	YP_001013863
Protein GI	124024747
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1903] Cobalamin biosynthesis protein CbiD
TIGRFAM ID	[TIGR00312] cobalamin biosynthesis protein CbiD

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.136591
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAATCAAT TTACTCTTCC CGTTTGGGTG GTTGCTGCTG CAAAGTCAGC AACGAATATT 
CTTATTGGTA ATAAATTTAG GGATAAAGAG CGAATTGATT TACCAAATAA AGAAGAATCG 
ATTTCGGTAC CTATTTCTTC TTCTGCTTTA CTCGATAACG GTAAAAGATC TTTAGCAGTA 
AGTCATTGTC AGTCTGGATT GCCTCTTGAC ATAACAAGAG GAGTAGAAAT CTGGGCTTAT 
ATTCAATTAA GTAAAGGAAG TTCTCAATCT AAAGGGAAAG TTCAAAATGG TTTTCCTGAT 
TGGCTTGATT TTCATGCCGG TTGTGGAGTA GGTAAATTTC AATCATCTGG TCAGCCATGT 
ATTTCTCAGT TTGCGCGTGA CTTGCTATGT ATTAATCTTT ACCCTCTTGT ACCCAAAGGT 
AATTCAATTA AAGTTGAGAT TATTTTACCT GAAGGGAAAG ATCGTGCATC AAAGACAAGT 
AATGAAGCCT TTGGAGTTGT AGATGGATTG TCCCTCATTG GGACCCAGGC TGAGGTTCAA 
ATTAGTGCTT CTCCAGATCA GTTGAAAAAC TGCAAAGAGA TTTTGTACCA CAAATGCTCT 
GAAGCAAAAT TTGATGGATG TTTGACTTTT GTGATTGGTG AAAATGGAAT GGATTTAGCG 
ATGAAATATG GCCTGCCAGC TAATCAAATT ATTAAAACCG GGAATTGGCT AGGTCCTCTT 
CTTGTTGCTG CTGCAGAAAA TGGAGTCAAG AAACTTTTAT TATTTGGATA TCATGGAAAA 
CTTATAAAAC TTTCTGGCGG CGTTTTTCAT ACACATCATC ATCTTGCTGA TGGAAGGATT 
GAAATACTCA CGTCACTTGC ATTCAGAGAA GGAATCTCAT TTGATTTGAT TGAGTTAATA 
AGTAAATCAA CATCAGTGGA AAATGCTTTA TTAACCCTTG AAGTAAGTAA CCCAGATGCT 
GTGTCTTTGA TATGGAGCAG GATGGCTAAA GAAATTGAAA TTAAAAGCAG AAGCTATGTG 
AATAGATACT TGTCTTCATC AATGGAAATA GGATCTGTTT TATTTGATCG TAAGAGACAA 
ATGCGTTGGG CTGGTCTTGA GGGTTTAAAA CAGATTAATT CTTTGGGGTT AATTCTTAAG 
CGATAG

Protein sequence

MNQFTLPVWV VAAAKSATNI LIGNKFRDKE RIDLPNKEES ISVPISSSAL LDNGKRSLAV 
SHCQSGLPLD ITRGVEIWAY IQLSKGSSQS KGKVQNGFPD WLDFHAGCGV GKFQSSGQPC 
ISQFARDLLC INLYPLVPKG NSIKVEIILP EGKDRASKTS NEAFGVVDGL SLIGTQAEVQ 
ISASPDQLKN CKEILYHKCS EAKFDGCLTF VIGENGMDLA MKYGLPANQI IKTGNWLGPL 
LVAAAENGVK KLLLFGYHGK LIKLSGGVFH THHHLADGRI EILTSLAFRE GISFDLIELI 
SKSTSVENAL LTLEVSNPDA VSLIWSRMAK EIEIKSRSYV NRYLSSSMEI GSVLFDRKRQ 
MRWAGLEGLK QINSLGLILK R