Gene YpAngola_A2943 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A2943
Symbol	tbpA
ID	5801415
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	3097844
End bp	3098890
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	49%
IMG OID	641340790
Product	thiamine transporter substrate binding subunit
Protein accession	YP_001607320
Protein GI	162421366
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4143] ABC-type thiamine transport system, periplasmic component
TIGRFAM ID	[TIGR01254] ABC transporter periplasmic binding protein, thiB subfamily [TIGR01276] thiamine ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.683707
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAACTA CCGCCTCAGA TACCTTTGCC ACCTTTATGT TCAAGGAGTG CAAAGTGTTT 
AAACACATTA TTTCCTGCTT ATTACTGATA TCAGCCACCT CCGCGCTTGC CGCAGAAAAA 
CCTACGCTGA CGGTCTATAC CTACGACTCC TTTGCTGCTG ACTGGGGCCC AGGCCCGGCG 
ATTAAGCAGG CCTTTGAAGC TGAATGCGAT TGCCAGCTAA AATTTGTGGC ACTGGAAGAT 
GGCGTTTCAC TGCTGAACCG CCTGCGGATG GAAGGTAAAA ACAGCCAGGC CGATGTGATT 
TTAGGGTTGG ATAACAATCT GGTACAGGCG GCAGAACAAA CCGGCTTGTT TACCCCAAGC 
CAGGTTGATA CCCGTAACCT GACCCTACCA GAGCCGTGGC AGAATAAGAC ATTTGTCCCT 
TACGATTATG GCTATTTTGC TTTTGTGTAT AACAAAGAAA AACTGAAAAA CCCGCCAAAA 
AGCCTGCACG AATTAATCAG CAGTAAAGAA CCGTGGAAAG TGATTTATCA AGACCCACGT 
ACCAGCACTC CAGGTCTGGG TCTGATGCTG TGGATGCAAA AAGTTTATGG CGATCAAGCC 
CCGCAAGCAT GGCAACAACT GGCGCAGAAA ACGGTCACAG TCACCAAAGG CTGGAGCGAG 
GCGTATGGCT TGTTCCTCAA GGGGGAAGCG GATTTAGTGC TGAGCTACAC CACCTCTCCG 
GCTTATCATT TAATTGCAGA AAAGAATAAC AACTATGCAG CCGCCGATTT CAGTGAAGGC 
CACTATTTAC AAGTAGAAGT CGCCGGCCAA CTGGCCGCCA GCAAACAACC TGAACTGGCG 
CAGCGCTTTA TGCAATTTAT CGTGACCCCT GCGTTCCAAA ACCACATTCC AACCGGCAAC 
TGGATGTATC CAGTGATCAA AATGGATCTA CCCGCCGGGT TCGAGACACT GGCCGTGCCA 
CAAACAGCGT TGCAATTTGA TGCTAAAGAC GTGGCGGATA ACCGCAGTAA ATGGATTCAG 
GCATGGCAAT CCGCCGTCAG CCGTTAA

Protein sequence

MLTTASDTFA TFMFKECKVF KHIISCLLLI SATSALAAEK PTLTVYTYDS FAADWGPGPA 
IKQAFEAECD CQLKFVALED GVSLLNRLRM EGKNSQADVI LGLDNNLVQA AEQTGLFTPS 
QVDTRNLTLP EPWQNKTFVP YDYGYFAFVY NKEKLKNPPK SLHELISSKE PWKVIYQDPR 
TSTPGLGLML WMQKVYGDQA PQAWQQLAQK TVTVTKGWSE AYGLFLKGEA DLVLSYTTSP 
AYHLIAEKNN NYAAADFSEG HYLQVEVAGQ LAASKQPELA QRFMQFIVTP AFQNHIPTGN 
WMYPVIKMDL PAGFETLAVP QTALQFDAKD VADNRSKWIQ AWQSAVSR