Gene SeD_A0466 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0466
Symbol	thiI
ID	6871042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	481192
End bp	482640
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	53%
IMG OID	642783692
Product	thiamine biosynthesis protein ThiI
Protein accession	YP_002214379
Protein GI	198242480
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0301] Thiamine biosynthesis ATP pyrophosphatase
TIGRFAM ID	[TIGR00342] thiazole biosynthesis/tRNA modification protein ThiI

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	97
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTTA TCATTAAATT GTTCCCGGAA ATCACTATCA AAAGCCAATC TGTGCGTTTG 
CGCTTTATAA AAATTTTAAC CGGGAACATC CGTAACGTTT TAAAGCACTA CGATGAGACC 
CTCGCGGTTG TCCGTCACTG GGATAACATT GAAGTTCGCG CCAAAGATGA AAACCAGCGT 
CTGGCGATTC GCGACGCGCT GACCCGCATC CCGGGGATTC ACCATATTCT TGAAGTCGAA 
GATGTGCCGT TCACCGATAT GCACGACATT TTCGAGAAAG CGTTGGCGCA GTATCGCGAA 
CAGCTTGAAG GCAAAACCTT CTGCGTGCGG GTAAAACGTC GCGGTAAGCA TGAGTTTAGC 
TCCATTGAAG TGGAGCGCTA TGTTGGCGGC GGATTAAATC AGCATATTGA ATCGGCGCGC 
GTGAAGCTCA CTAACCCGGA TGTGACGGTG CATCTGGAAG TGGAAGATGA TCGCCTGCTG 
CTGATCAAAG GGCGTTATGA AGGTATTGGC GGTTTCCCGA TTGGCACCCA GGAAGATGTG 
CTGTCGCTGA TCTCCGGCGG TTTTGACTCC GGCGTCTCCA GCTATATGCT GATGCGTCGC 
GGCTGTCGCG TACACTACTG CTTCTTTAAC CTTGGCGGCG CGGCGCATGA AATCGGCGTT 
CGCCAGGTGG CGCATTACCT GTGGAACCGC TTTGGCAGCT CCCATCGCGT GCGTTTTGTG 
GCGATTAACT TCGAACCGGT GGTCGGCGAG ATTCTGGAGA AAGTTGACGA CGGCCAGATG 
GGCGTGGTGC TCAAACGTAT GATGGTACGC GCGGCGTCGA AAGTGGCGGA ACGTTACGGC 
GTACAGGCGC TGGTGACCGG CGAAGCGCTG GGCCAGGTAT CCAGCCAGAC GCTAACCAAC 
TTGCGCTTGA TCGATAACGT GTCTGACACG CTGATCCTGC GCCCGCTGAT CTCTTACGAT 
AAAGAGCACA TTATCAACCT GGCGCGCCAG ATTGGTACGG AAGATTTTGC CCGTACGATG 
CCGGAATACT GTGGCGTGAT TTCAAAAAGT CCGACGGTGA AAGCCATTAA AGCGAAAATT 
GAAGCCGAAG AAGAAAATTT CGACTTCAGT ATTCTCGATA AGGTGGTAGA AGAAGCGAAC 
AACGTCGATA TTCGTGAAAT CGCCCAGCAG ACCCAGCAGG AGGTGGTGGA AGTAGAAACC 
GTGAGCGGTT TCGGCCCGAA CGACGTGATT CTGGATATCC GTTCTGTGGA TGAGCAGGAT 
GACAAGCCGC TGAAAGTGGA AGGTGTGGAC GTCGTTTCGC TGCCGTTCTA CAAGCTGAGC 
ACTAAATTTG GCGACCTCGA TCAGAGCAAA ACCTGGCTGC TGTGGTGCGA ACGCGGGGTA 
ATGAGCCGCC TGCAGGCGCT CTATCTGCGC GAGCAGGGCT TTGAAAACGT GAAAGTGTAT 
CGTCCGTAA

Protein sequence

MKFIIKLFPE ITIKSQSVRL RFIKILTGNI RNVLKHYDET LAVVRHWDNI EVRAKDENQR 
LAIRDALTRI PGIHHILEVE DVPFTDMHDI FEKALAQYRE QLEGKTFCVR VKRRGKHEFS 
SIEVERYVGG GLNQHIESAR VKLTNPDVTV HLEVEDDRLL LIKGRYEGIG GFPIGTQEDV 
LSLISGGFDS GVSSYMLMRR GCRVHYCFFN LGGAAHEIGV RQVAHYLWNR FGSSHRVRFV 
AINFEPVVGE ILEKVDDGQM GVVLKRMMVR AASKVAERYG VQALVTGEAL GQVSSQTLTN 
LRLIDNVSDT LILRPLISYD KEHIINLARQ IGTEDFARTM PEYCGVISKS PTVKAIKAKI 
EAEEENFDFS ILDKVVEEAN NVDIREIAQQ TQQEVVEVET VSGFGPNDVI LDIRSVDEQD 
DKPLKVEGVD VVSLPFYKLS TKFGDLDQSK TWLLWCERGV MSRLQALYLR EQGFENVKVY 
RP