Gene EcHS_A0488 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0488
Symbol	thiL
ID	5594310
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	499426
End bp	500403
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	55%
IMG OID	640919671
Product	thiamine monophosphate kinase
Protein accession	YP_001457256
Protein GI	157159938
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	73
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATGTG GCGAGTTCTC CCTGATTGCC CGTTATTTTG ACCGTGTAAG AAGTTCTCGT 
CTTGATGTCG AACTGGGCAT CGGCGACGAT TGCGCTCTTC TCAATATCCC CGAGAAACAG 
ACCCTGGCGA TCAGCACTGA TACGCTGGTG GCGGGCAACC ACTTCCTCCA TGATATCGAT 
CCTGCTGATC TGGCGTATAA AGCACTGGCG GTGAACCTAA GCGATCTGGC AGCGATGGGG 
GCCGATCCGG CCTGGCTGAC GCTGGCATTA ACCTTACCGG ACGTAGACGA AGCGTGGCTT 
GAGTCCTTCA GCGACAGTTT GTTTGATCTT CTCAATTATT ACGATATGCA ACTCATTGGC 
GGCGATACCA CGCGTGGGCC ATTATCAATG ACGTTGGGTA TCCACGGCTT TGTTCCGATG 
GGACGAGCCT TAACGCGCTC TGGAGCGAAA CCGGGTGACT GGATCTATGT GACCGGTACA 
CCGGGCGATA GCGCCGCCGG GCTGGCGATT TTGCAAAACC GTTTGCAGGT TGCCGATGCT 
AAAGATGCGG ACTACTTGAT CAAACGTCAT CTCCGTCCAT CGCCGCGTAT TTTACAGGGA 
CAGGCACTGC GCGATCTGGC AAATTCAGCT ATCGATCTCT CTGACGGTCT GATTTCCGAT 
CTCGGGCATA TCGTGAAAGC CAGCGACTGC GGCGCACGTA TTGACCTGGC ATTGCTGCCG 
TTTTCTGATG CGCTTTCTCG CCATGTTGAA CCGGAACAGG CGCTGCGCTG GGCGCTCTCT 
GGCGGTGAAG ATTACGAGTT GTGTTTCACT GTGCCGGAAC TGAACCGTGG CGCGCTGGAT 
GTGGCTCTCG GACACCTGGG CGTACCGTTT ACCTGTATCG GGCAAATGAC CGCCGATATC 
GAAGGGCTTT GTTTTATTCG TGACGGCGAA CCTGTCACGT TTGACTGGAA AGGATATGAC 
CATTTTGCCA CGCCATAA

Protein sequence

MACGEFSLIA RYFDRVRSSR LDVELGIGDD CALLNIPEKQ TLAISTDTLV AGNHFLHDID 
PADLAYKALA VNLSDLAAMG ADPAWLTLAL TLPDVDEAWL ESFSDSLFDL LNYYDMQLIG 
GDTTRGPLSM TLGIHGFVPM GRALTRSGAK PGDWIYVTGT PGDSAAGLAI LQNRLQVADA 
KDADYLIKRH LRPSPRILQG QALRDLANSA IDLSDGLISD LGHIVKASDC GARIDLALLP 
FSDALSRHVE PEQALRWALS GGEDYELCFT VPELNRGALD VALGHLGVPF TCIGQMTADI 
EGLCFIRDGE PVTFDWKGYD HFATP