Gene SNSL254_A0466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0466
Symbol	thiL
ID	6485039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	476429
End bp	477409
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	57%
IMG OID	642735887
Product	thiamine monophosphate kinase
Protein accession	YP_002039661
Protein GI	194445595
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATGTG GCGAGTTTTC CCTGATTGCC CGTTATTTTG ACCGTGTAAG AAGCTCTCGT 
CTTGATGTTG AAACCGGTAT TGGCGACGAT TGCGCGCTCC TGAATATTCC TGAAAAGCAG 
ACCCTGGCGA TCAGTACCGA TACGCTGGTG GCGGGCATCC ATTTCTTACC CAATATCGAT 
CCTGCCGATC TGGCGTATAA AGCGCTGGCG GTGAATTTAA GCGATCTGGC GGCGATGGGC 
GCCGATCCGG CATGGTTAAC GCTGGCGCTC ACGCTTCCTG ACGTCGATGA GGCGTGGCTT 
GCCGCGTTCA GCGACAGCCT GTTTGAACAA CTGGATTACT ACGACATGCA GCTCATTGGC 
GGCGATACCA CGCGCGGCCC GCTGTCGATG ACGCTCGGTA TTCATGGCCT TGTGCCAGCC 
GGTCGGGCGC TGAAACGTTC TGGCGCAAAA CCGGGCGACT GGATTTATGT TACTGGCACG 
TTGGGCGATA GCGCTGCCGG GCTGGCGATT CTACGGGGTG ATTTTCGCGT GGGAAGCTGG 
GGGGATGCCG ACTATCTGGT CAAACGCCAT CTGCGCCCGA CGCCGCGTAT TTTACAAGGA 
CAGGCGCTAC GCGATCTCGC CAGTTCGGCG ATCGATCTTT CCGACGGTTT GATCTCCGAT 
CTTGGTCACA TTCTGCAAGC CAGCAACTGC GGCGCGCGAA TCGATTTGGA GGCGCTGCCT 
GACTCCGAAG AACTGTGGGG ACATGCCAAT GATCCCGAAC AAAAGCTTCG CTGGATGTTA 
TCCGGCGGCG AAGATTATGA ACTGTGCTTT ACCGTCCCGG AGCTGAACCG TGGCGCGCTG 
GATGTCGCGC TTGGTCATCT GGGCGTGCCG TTTACCTGTA TCGGGCAAAT GACGGCGGAT 
ATCGAAGGGA TCGCCTTTGT GCGTGACGGA GAACCTGTCA CTTTTGACTG GAAAGGATAT 
GACCATTTTG CCACGCCATA A

Protein sequence

MACGEFSLIA RYFDRVRSSR LDVETGIGDD CALLNIPEKQ TLAISTDTLV AGIHFLPNID 
PADLAYKALA VNLSDLAAMG ADPAWLTLAL TLPDVDEAWL AAFSDSLFEQ LDYYDMQLIG 
GDTTRGPLSM TLGIHGLVPA GRALKRSGAK PGDWIYVTGT LGDSAAGLAI LRGDFRVGSW 
GDADYLVKRH LRPTPRILQG QALRDLASSA IDLSDGLISD LGHILQASNC GARIDLEALP 
DSEELWGHAN DPEQKLRWML SGGEDYELCF TVPELNRGAL DVALGHLGVP FTCIGQMTAD 
IEGIAFVRDG EPVTFDWKGY DHFATP