Gene P9515_14351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9515_14351
Symbol	thiE
ID	4718721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9515
Kingdom	Bacteria
Replicon accession	NC_008817
Strand	+
Start bp	1272654
End bp	1273715
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	30%
IMG OID	640081122
Product	thiamine-phosphate pyrophosphorylase
Protein accession	YP_001011749
Protein GI	123966668
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0352] Thiamine monophosphate synthase
TIGRFAM ID	[TIGR00693] thiamine-phosphate pyrophosphorylase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACAAC CAAAAATAAA TCAACCGGAA GACTTACGAA TTTCTCAGAT TATTGACGCC 
AATCTAGATA GAGCAAGAGA AGGATTAAGA GTCTTAGAGG ACTGGGCCAG ATTTGGCTTA 
GGAAATGAAG ATTTTGTCAT AAGAATAAAA AACCTCCGAC AAATATTAGG TAAAAATCAT 
TTAGAAATTT ACAAAAAATC AAGAAATCAT ATAGAAGATC AATGTAAAGG GTTATCTCAT 
ATTGAACAAA TCCACCGGAA AAGTCCCTCT AAAATAATAA GTTCTAATTC TGCTAGGGTT 
CAAGAGGCTC TTAGAGTTAT TGAAGAGTTT TCAAGAAACC ATAATAATAA ACTTTCCAAA 
ATAGCTTCTG ATATTAGATA TGAAATTTAC ACTTTAGAAA TTGAACTATT AAATCTAAAC 
ACTCGTAAGA GAGCAGAGTT AATAATTAGA GAAAACAATT TATATTCGAT AACAGATCAT 
AGAGACAACT TATTACAAAT AATTGAAAAA ATATTGTTAG GAGGAGTAAA AATTATTCAG 
CACAGATTTA AAGAAGGTAA TGATAAAAAT CATCTCAAAG AAGCAATTCA AGTAAAGAAC 
CTATGTGAAA AATATAATTC TTTGTTCATC GTTAATGACA GAGTAGATAT AGCAATGGCA 
TCAAATGCAG ACGGTGTTCA TCTTGGGCAA GAAGACATTG ATGTAAAAAC AGCAAGAAAA 
TTACTAGGCA GTTCTAAAAT CATTGGTGTT TCAGCAAATA ATTCAACTGA TATCAATAAA 
GCTATAAAAG ATGGATGCGA TTACATTGGT ATTGGGCCAG TTTTTCAATC CTTAACAAAA 
AAGGGAAAAG AACCACTCGG GGTTGAGAAG ATTAAAACTT TAATAAAAGA TATAAACATT 
CCTTGTTTTG CTATAGGAGG TATTAACAAA TTAAATATTT CTTGTTTAAA AAGTCATAGA 
ATTAGCAAGG TTGCAGTAGT TTCAGGGCTA CTAAATTCAG AAGATCCAAA AGAAGAAGCT 
ATTATTATCT TAAAAAAACT TTCCAATGAA AATTATAGTT AA

Protein sequence

MEQPKINQPE DLRISQIIDA NLDRAREGLR VLEDWARFGL GNEDFVIRIK NLRQILGKNH 
LEIYKKSRNH IEDQCKGLSH IEQIHRKSPS KIISSNSARV QEALRVIEEF SRNHNNKLSK 
IASDIRYEIY TLEIELLNLN TRKRAELIIR ENNLYSITDH RDNLLQIIEK ILLGGVKIIQ 
HRFKEGNDKN HLKEAIQVKN LCEKYNSLFI VNDRVDIAMA SNADGVHLGQ EDIDVKTARK 
LLGSSKIIGV SANNSTDINK AIKDGCDYIG IGPVFQSLTK KGKEPLGVEK IKTLIKDINI 
PCFAIGGINK LNISCLKSHR ISKVAVVSGL LNSEDPKEEA IIILKKLSNE NYS