Gene P9303_19391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_19391
Symbol	thiE
ID	4777528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	1706747
End bp	1707808
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	55%
IMG OID	640087449
Product	thiamine-phosphate pyrophosphorylase
Protein accession	YP_001017946
Protein GI	124023639
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0352] Thiamine monophosphate synthase
TIGRFAM ID	[TIGR00693] thiamine-phosphate pyrophosphorylase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.706748
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCGA TGCCTGTCGC CCCGATCGCA GATCTACGTG TGGCTCAGCT GATCGATGCC 
AACCTCGATC GAGCTCGAGA AGGACTGCGA GTCGTCGAAG ACTGGTGCCG CTTCGGCCTA 
GATCGTGAAG ACCTTGTGGT GACTCTCAAA GACTGGCGTC AGCGACTGGG TCGCCATCAT 
CACGACAGCT ACAAACAGGC ACGCTCCACT GCTACAGATC AAGGGATCGG CCTCAGTCAT 
CCTGCTCAGC AAGAGCGACA CGAACCATGG CATGTTGTGG CAGCCAACTG TGCACGCGTT 
CAAGAAGCTC TACGCGTACT GGAAGAGTTC GCCCGTCAGC CAGATCCTCA GCTGGCTGCC 
AGCGCTGCTG CAATCCGCTA TGGCCTCTAC GACCTAGAGG TGACCGTGCT GCAGGCCAAC 
GCAGGCAAAA AGAGACGCCA ACAACTGCAG GCCTGCCATC TTTGCCTGAT TACGACATCA 
CAATCCGATC TAGCCAACAA CGATCTATTC AGAACAGTGA GCGCAGCACT AGTCGCTGGC 
ATCGACATGG TGCAATACCG CAATAAAGAA GCTAGCGACT TGCAACGACT GACTCAGGCA 
AAAGAGCTGG CCAGCCTATG CAGAAAGCAT GGGGCGCTAT TCATCGTTAA TGACCGAATC 
GACTTAGCCC TTGCAGTGGA CGCCGATGGC GTTCATCTCG GCCAGGACGA CCTCCCCACA 
GACGTAGCCA GGGGACTGAT CGGCAGCGAA CGACTACTGG GTCGAAGCAC ACAGTTCCTT 
GCCCAGCTTC AAAAAGCTGA AGCAGAAGGT TGCGACTATC TAGGAGTAGG GCCTGTCAAC 
AGCACAGCCA CAAAACCGGA ACGACAACCA ATTGGGCTTG CCTATGTGAA GGAGGCATCT 
AAAGCCACCC AGCTACCTTG GTTTGCCATT GGTGGCATCA ACATCTCAAA CCTAGAAGCA 
GTACGTCAAG CCGGAGCAAA GCGAATCGCT GTGATCGGAG CGATCATGAA TTCCAAAGAT 
CCTGCCGCTA CCAGCCTTCA ACTACTGGAG GCTCTGAGAT GA

Protein sequence

MKSMPVAPIA DLRVAQLIDA NLDRAREGLR VVEDWCRFGL DREDLVVTLK DWRQRLGRHH 
HDSYKQARST ATDQGIGLSH PAQQERHEPW HVVAANCARV QEALRVLEEF ARQPDPQLAA 
SAAAIRYGLY DLEVTVLQAN AGKKRRQQLQ ACHLCLITTS QSDLANNDLF RTVSAALVAG 
IDMVQYRNKE ASDLQRLTQA KELASLCRKH GALFIVNDRI DLALAVDADG VHLGQDDLPT 
DVARGLIGSE RLLGRSTQFL AQLQKAEAEG CDYLGVGPVN STATKPERQP IGLAYVKEAS 
KATQLPWFAI GGINISNLEA VRQAGAKRIA VIGAIMNSKD PAATSLQLLE ALR