Gene SeHA_C0114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0114
Symbol	tbpA
ID	6492061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	120886
End bp	121869
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	55%
IMG OID	642740402
Product	thiamine transporter substrate binding subunit
Protein accession	YP_002044076
Protein GI	194449014
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4143] ABC-type thiamine transport system, periplasmic component
TIGRFAM ID	[TIGR01254] ABC transporter periplasmic binding protein, thiB subfamily [TIGR01276] thiamine ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.51564
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.157223
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTAAAAA AATATCTTCC ACTTTTACTC CTGTGCGCGG CGCCTGCTTT CGCCAAACCC 
GTTCTCACCG TCTATACCTA CGACTCGTTC GCCGCCGACT GGGGGCCAGG CCCGGCGGTG 
AAAAAAGCGT TTGAAGCCGA TTGCAACTGC GAGCTGAAAC TGGTGGCGCT GGAGGATGGC 
GTTTCGCTGC TCAACCGCCT GCGGATGGAG GGGAAGAACA GCAAAGCCGA TGTGGTGTTG 
GGGCTGGACA ACAATCTGCT GGAAGCGGCC ACGCAAACTA AACTCTTTGC CAAAAGCGGC 
GTGGCGAATG AAGCGGTCAA GGTGCCCGGC GGCTGGAAAA ACGACACATT TGTGCCATTC 
GATTACGGCT ATTTCGCCTT TGTCTACGAT AAAAGCAAGC TGAAAAATCC GCCGAAAAGC 
CTGAAAGAAC TGGTCGAGAG CGATCAAAAA TGGCGGGTGA TTTATCAGGA CCCACGTACC 
AGTACGCCAG GGCTGGGGCT GTTACTGTGG ATGCGCAAAG TCTATGGCGA TAACGCGCCG 
CAGGCCTGGC AAAAACTGGC GGCCAAAACG GTGACGGTGA CGAAAGGCTG GAGCGAGGCC 
TACGGTTTAT TTCTGAAAGG TGAAAGCGAT TTGGTGCTCA GTTACACCAC CTCTCCGGCG 
TATCACATTA TTGAAGAGAA GAAGGACAAT TACGCCGCCG CGAACTTCAG CGAAGGCCAT 
TACTTACAGG TAGAAGTCGC GGCGCGTACC GTCGCCAGTA AGCAGCCGGA ACTGGCGGAG 
AAATTCCTCA AATTTATGGT TTCTCCGGCG TTTCAGAACG CCATACCCAC CGGCAACTGG 
ATGTACCCGG TAGCGGACGT CGCCTTACCC GCAGGGTTTG AATCATTGGC CAAACCCGCC 
ACAACGCTGG AATTCACGCC GCAACAAGTG GCAGCACAAC GCCAGGCATG GATTAGCGAA 
TGGCAACGCG CCGTCAGCCG TTAA

Protein sequence

MLKKYLPLLL LCAAPAFAKP VLTVYTYDSF AADWGPGPAV KKAFEADCNC ELKLVALEDG 
VSLLNRLRME GKNSKADVVL GLDNNLLEAA TQTKLFAKSG VANEAVKVPG GWKNDTFVPF 
DYGYFAFVYD KSKLKNPPKS LKELVESDQK WRVIYQDPRT STPGLGLLLW MRKVYGDNAP 
QAWQKLAAKT VTVTKGWSEA YGLFLKGESD LVLSYTTSPA YHIIEEKKDN YAAANFSEGH 
YLQVEVAART VASKQPELAE KFLKFMVSPA FQNAIPTGNW MYPVADVALP AGFESLAKPA 
TTLEFTPQQV AAQRQAWISE WQRAVSR