Gene NATL1_14871 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_14871
Symbol	bioB
ID	4779672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	1197337
End bp	1198374
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	40%
IMG OID	640084768
Product	biotin synthase
Protein accession	YP_001015309
Protein GI	124026193
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.598492
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCTAA TTAATCCTAA TATCCAGGAA TCTAATAAAC TCAAGTTCAA AGACGAATCA 
TATTTAGATT TTAATTCCAT AAATGGTGGA GATATTAGAC ATGATTGGTC TTCAGAAGAA 
ATCAAAGAAA TACTTGATTT GCCGTTAATG GATTTGTTGT GGAGAGCTCA AATAGTTCAT 
AGGTCTTACA ATCCCGGTTA TAAAGTTCAG CTTGCTTCTC TTCTAAGTGT GAAGACAGGT 
GGATGCTCAG AAGACTGTGC ATATTGTCCT CAATCTGTTC ACAATGAAAC AACTGTTCAA 
CCTAATCCTG TAATTGAAGT TGAGTCAGTT CTTGATAGAG CAAGAGCTGC AAAAGATGCA 
GGAGCAGATA GATTTTGCAT GGGTTGGGCT TGGCGTGAGA TCAAAGACGG AAACGCATTC 
GATTCAATGC TTGAAATGGT AAGAGGTGTT AGAGAGCTTG GCCTTGAGGC ATGTGTCACC 
GCTGGAATGA TTACTGATTC TCAAGCCTCT AGATTGGCAG AAGCAGGTTT AACAGCCTAT 
AACCATAATT TAGATACTAG TCCTGAGCAT TATTCCAAAA TCATTTCAAC AAGAACATAT 
CAAGATCGAC TTGAAACATT GAGAAGAGTA CGCATGGCTG GAATTACAGT GTGCTGTGGT 
GGGATTATTG GCATGGGGGA ATCTGTTTCA GATAGAGCAT CTTTACTTAA GGTTTTAGCA 
ACTTTAGACC CGCATCCTGA AAGTGTACCT ATTAATGCGT TGGTTGCAGT GGAGGGGACA 
CCCATGGAGG ATTTGTCTTC TATCGATCCA TTAGAGATGG TTCGTATGGT CGCGACGGCA 
AGGGTTATTA TGCCTAAAAG CCGAATAAGA CTTAGCGCAG GGAGACAACA ATTAGGTAGG 
GAAGCTCAGA TTCTATGTCT ACAATCTGGA GCTGATTCTA TATTTTATGG AGATACACTT 
TTAACTACAA GCAATCCGGA GGTGGAAGCA GACCGTAAGC TTTTAGCGGA TGCTGGAATT 
ACGGCTAATT TCTCTTAA

Protein sequence

MTLINPNIQE SNKLKFKDES YLDFNSINGG DIRHDWSSEE IKEILDLPLM DLLWRAQIVH 
RSYNPGYKVQ LASLLSVKTG GCSEDCAYCP QSVHNETTVQ PNPVIEVESV LDRARAAKDA 
GADRFCMGWA WREIKDGNAF DSMLEMVRGV RELGLEACVT AGMITDSQAS RLAEAGLTAY 
NHNLDTSPEH YSKIISTRTY QDRLETLRRV RMAGITVCCG GIIGMGESVS DRASLLKVLA 
TLDPHPESVP INALVAVEGT PMEDLSSIDP LEMVRMVATA RVIMPKSRIR LSAGRQQLGR 
EAQILCLQSG ADSIFYGDTL LTTSNPEVEA DRKLLADAGI TANFS