Gene SeD_A0112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0112
Symbol	tbpA
ID	6874660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	120984
End bp	121967
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	55%
IMG OID	642783365
Product	thiamine transporter substrate binding subunit
Protein accession	YP_002214059
Protein GI	198245931
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4143] ABC-type thiamine transport system, periplasmic component
TIGRFAM ID	[TIGR01254] ABC transporter periplasmic binding protein, thiB subfamily [TIGR01276] thiamine ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTAAAAA AATATCTTCC GCTTTTACTC CTGTGCGCGG CGCCTGCTTT CGCCAAACCC 
GTTCTCACCG TCTATACCTA CGACTCGTTC GCCGCCGACT GGGGGCCAGG CCCGGCGGTG 
AAAAAAGCGT TTGAAGCCGA TTGCAACTGC GAGCTGAAAC TGGTGGCGCT GGAGGATGGC 
GTTTCGCTGC TCAACCGCCT GCGGATGGAG GGGAAGAACA GCAAAGCCGA TGTGGTGTTG 
GGGCTGGACA ATAATCTGCT GGAAGCGGCC ACGCAAACTA AACTCTTTGC CAAAAGCGGC 
GTGGCGAATG AGGCGGTCAA GGTGCCCGGC GGCTGGAAAA ACGACACATT TGTGCCGTTC 
GATTACGGCT ATTTCGCCTT TGTCTACGAT AAAAGCAAGC TGAAAAATCC GCCGAAAAGC 
CTGAAAGAAC TGGTCGAGAG CGATCAAAAA TGGCGGGTAA TTTATCAGGA CCCGCGTACC 
AGTACGCCAG GGCTGGGGCT GTTACTGTGG ATGCGCAAAG TCTATGGCGA TAACGCGCCG 
CAGGCCTGGC AAAAACTGGC GGCCAAAACG GTGACGGTGA CGAAAGGCTG GAGCGAGGCC 
TACGGCTTAT TTCTGAAAGG TGAAAGCGAT TTGGTGCTCA GTTACACCAC CTCTCCGGCG 
TATCACATTA TTGAAGAGAA GAAGGACAAT TACGCCGCCG CGAACTTCAG CGAAGGCCAT 
TACTTACAGG TAGAAGTCGC GGCGCGTACC GTCGCCAGTA AGCAGCCGGA ACTGGCGGAG 
AAATTCCTCA AATTTATGGT TTCTCCGGCG TTTCAGAACG CCATACCCAC CGGCAACTGG 
ATGTACCCGG TAGCGGACGT CGCCTTACCA GCAGGGTTTG AATCATTGGC CAAACCCGCC 
ACAACGCTGG AATTCACGCC GCAACAAGTG GCAGCACAAC GCCAGGCATG GATTAGCGAA 
TGGCAACGCG CCGTCAGCCG TTAA

Protein sequence

MLKKYLPLLL LCAAPAFAKP VLTVYTYDSF AADWGPGPAV KKAFEADCNC ELKLVALEDG 
VSLLNRLRME GKNSKADVVL GLDNNLLEAA TQTKLFAKSG VANEAVKVPG GWKNDTFVPF 
DYGYFAFVYD KSKLKNPPKS LKELVESDQK WRVIYQDPRT STPGLGLLLW MRKVYGDNAP 
QAWQKLAAKT VTVTKGWSEA YGLFLKGESD LVLSYTTSPA YHIIEEKKDN YAAANFSEGH 
YLQVEVAART VASKQPELAE KFLKFMVSPA FQNAIPTGNW MYPVADVALP AGFESLAKPA 
TTLEFTPQQV AAQRQAWISE WQRAVSR