Gene Smed_3107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3107
Symbol	tbpA
ID	5323986
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	3252828
End bp	3253856
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	61%
IMG OID	640792057
Product	thiamine transporter substrate binding subunit
Protein accession	YP_001328768
Protein GI	150398301
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4143] ABC-type thiamine transport system, periplasmic component
TIGRFAM ID	[TIGR01254] ABC transporter periplasmic binding protein, thiB subfamily [TIGR01276] thiamine ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCATTT CACTCCACGG CAGAACACTT GCCGGGTTCA TGATTGCAGC GGCCACCGTC 
ACGGGCGTTT CCGCAAGTGC TTTCGCCGCG GAAAAGACGC TGACGGTCTA CACTTACGAA 
AGCTTCATCA CAGAATGGGG GCCGGGCGCG AAGGTCTCCG AAGCCTTCGA GAAGGTCTGC 
GACTGCAAGG TCGATTATGT GGGCGTCGCC GACGGGGTCG AACTGCTGAC GCGGCTGAAG 
CTCGAAGGTG AGGGATCCAA AGCCGACGTC GTGCTCGGTC TCGACACCAA TCTCGTTGCC 
GAGGCCAAGG CGACCGGCTT CTTCGTTCCG CACGGCGTCG ATACCACTTC CGTCGATGTT 
CCTGGTGGTT TCACCGACGA CACCTTCATC CCCTATGACT ACGGCCATTT CGCCGTGGTG 
TACGATACCG AGATGCTGAA GAGCCCGCCG AAGAGCCTCA GGGATCTGGT GGAAGGCGAT 
CCAACGCAGA AGATCGTGAT CGAGGACCCG CGCACTTCCA CCCCCGGCCT CGGCCTGCTG 
CTTTGGGTGA AATCGGTCTA TGGCGATCGG GCCGGCGAGG CCTGGGCAAA GCTCAAGGCG 
CGTGTGCTGA CGGTCACGCC GGGCTGGTCG GAGGCCTATG GCCTCTTCAC CAAGGGTGAG 
GCGCCGATGG TTCTGTCCTA CACCACCTCG CCCGCATATC ACATGGTCGC GGAAGATACC 
GAGCGCTATC AGGCGGCCCC GTTCACCGAG GGCCACTACA TCCAGATCGA AGTCGCCGCA 
TTGACGAAGA ACGCGAAGGA CCCGGAGCTC GCCCGGAAGT TTCTGGACTT CATGATCGGT 
CCGGAATTCC AGTCGATCAT CCCGACGACC AATTGGATGA TGCCGGTGAC GGCCACAAAG 
GAACCGCTGC CGGAGGCCTT CGGAAAGCTC GTCGAACCCC GGAAGACCTT TCTCATCCCC 
TCCGAGGAGG TTGCGGCCAA CCGCAGGGCC TGGATCGATG AGTGGCTGAC GGCGATGAGC 
AGGAACTGA

Protein sequence

MSISLHGRTL AGFMIAAATV TGVSASAFAA EKTLTVYTYE SFITEWGPGA KVSEAFEKVC 
DCKVDYVGVA DGVELLTRLK LEGEGSKADV VLGLDTNLVA EAKATGFFVP HGVDTTSVDV 
PGGFTDDTFI PYDYGHFAVV YDTEMLKSPP KSLRDLVEGD PTQKIVIEDP RTSTPGLGLL 
LWVKSVYGDR AGEAWAKLKA RVLTVTPGWS EAYGLFTKGE APMVLSYTTS PAYHMVAEDT 
ERYQAAPFTE GHYIQIEVAA LTKNAKDPEL ARKFLDFMIG PEFQSIIPTT NWMMPVTATK 
EPLPEAFGKL VEPRKTFLIP SEEVAANRRA WIDEWLTAMS RN