Gene NATL1_00231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_00231
Symbol	thiL
ID	4779585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	25758
End bp	26747
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	35%
IMG OID	640083286
Product	putative thiamine-monophosphate kinase
Protein accession	YP_001013852
Protein GI	124024736
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACAACTA CTATTCAAGA TTTAGGTGAA ATAGAATTAC TAAATCGTTT AAAAAAATTT 
ATGCGCTGTG GACAAATAGA TGATGATGTC GCAGAAATAA ATAAAATAAA TAAAAGCTTA 
TTAATTAATA CTGATTTACT TGTAGAAAAA ATTCATTTTT CTGATGAAAT ATCTAATGCT 
AAAGATATTG GCTGGAAATG TATTACTACA AATATTTCTG ATCTTATTTG CAGCGGCTCA 
GAAAATATAA TTTCCTTTAC TGTTGGACTT GTTTTGCCGC CAAACACACA TTGGAAATGG 
GTTGAAAATC TATATGAAGG AATGTTGGAA GCGATGCAAG AATTTGGAGG AGAAATAATC 
GGTGGAGATT GCTCGTGCGG AGAAACAAAA ATGATTTCAA TTACAGCAAT TGGAGAAATG 
AATCTCCCCA GACTACATAG AGGAAATGCT TTACCTGGAG ATTACATTGT TAGCACTGGA 
ATCCATGGAT TAAGTAGGCT AGGCTTGGCA CTTTTAACAT CCGAGAAACT ACCAAGTGAA 
GCCCCAGTAA GTCCTAAGCT AATTAATAAG GCTATCAACG CACACAAACG CCCCTATCCT 
GCTTTAAAAG CACTCAAAGC TTTAAAAGCT TGTAAACCTC AATCAACAAG TTGGAGAGCC 
GCAGGGACTG ATAGCAGCGA TGGACTAATT GAATCAATTA GAGGAATTTG CCAAGCAAGT 
AATTGTCAAG CAATTTTATC AAAAACTTCT ATTCTCAAAC ATCCTGACTG GCCAGAAGAT 
GATATTTGGG ATGAATGGAT CCTGAATGGG GGTGAGGACT ATGAATTAAT ACTGAGTCTT 
CCTAAAGACT GGGCAAAGTC ATTATCAAAT AAATTAAAAT CTGCCAAAAT TATTGGGTTT 
ATCAAAGAAG GTAAACCCAA TATTTTCTGG GATAATTTAG AACAAACTAG AATTGACCAA 
TCAAGTCTAT TTAGACATTT TAAACTCTAG

Protein sequence

MTTTIQDLGE IELLNRLKKF MRCGQIDDDV AEINKINKSL LINTDLLVEK IHFSDEISNA 
KDIGWKCITT NISDLICSGS ENIISFTVGL VLPPNTHWKW VENLYEGMLE AMQEFGGEII 
GGDCSCGETK MISITAIGEM NLPRLHRGNA LPGDYIVSTG IHGLSRLGLA LLTSEKLPSE 
APVSPKLINK AINAHKRPYP ALKALKALKA CKPQSTSWRA AGTDSSDGLI ESIRGICQAS 
NCQAILSKTS ILKHPDWPED DIWDEWILNG GEDYELILSL PKDWAKSLSN KLKSAKIIGF 
IKEGKPNIFW DNLEQTRIDQ SSLFRHFKL