Gene TM1040_2818 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2818
Symbol	tbpA
ID	4076637
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2981594
End bp	2982574
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	58%
IMG OID	638008144
Product	thiamine transporter substrate binding subunit
Protein accession	YP_614812
Protein GI	99082658
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG4143] ABC-type thiamine transport system, periplasmic component
TIGRFAM ID	[TIGR01254] ABC transporter periplasmic binding protein, thiB subfamily [TIGR01276] thiamine ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0458711
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.879524
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATCCC TCATCTTTGC GAGCGCCACT TGTTTAGCTA CTGCAGTTGC CGCTGCGGAT 
ACGCCGGAAT TGGTGGTCTA TACTTACGAC AGCTTTGTCT CGGAATGGGG ACCCGGACCG 
GCCGTCGAAG AGGCTTTTGA AGCGGTCTGC GGATGCGATC TGAAATTCGT CGGCGCGGGC 
GATGGCGCTG CGCTGCTCGC GCGGATCAAA CTGGAAGGCG CTCGGTCTGA CGCGGATGTG 
GTCTTAGGGC TCGACACCAA CCTTACCGCG GCAGCCAAGG AAACCGGATT GTTTGCGCCA 
GTGTCGGTTG AGGCCGATTA CGCACTGCCA ATCACCTGGA GCGACACGCA TTTTGCCCCC 
TATGACTGGG GATATTTTGC ATTTGTTCAC AACGCAGATG TTCCGGCACC TTCGAACTTT 
GAAGCCTTGG CTGACAGTGA TCTGAAAATC GTGATCCAGG ATCCAAGGTC CTCGACGCCG 
GGACTGGGGC TCTTGATGTG GGTAAAGGCC GCATATGGGG AGGACGCGCC TGCCCTCTGG 
GAAGGTCTCA GCGACAATAT CGTCACCGTC ACCAAAGGCT GGTCCGAAGC ATACGGACTG 
TTCCTCGAAG GCGAGGCAGA TATGGTGCTC TCCTACACCA CGTCGCCCGC CTATCATCTG 
ATCGCCGAAG AGGACGACAG CAAGTCGGCT GCACTATTCG ATGAAGGTCA CTACATGCAG 
GTCGAGGTCG CGGGCAAGCT CGCGGCGAGC GATGAGAGCG CATTGGCGGA TCAGTTCCTC 
GAGTTCATGG TCTCTGATGC CTTCCAGTCG ATCATCCCAA CCACAAACTG GATGTACCCC 
GCCGTCACGC CTGATTCAGG CTTGCCACAG GGGTTTGAAA CCCTGATCAG CCCGGAGAAA 
TCACTGCTTC TGCCCGAGGA CGAAGCCGCT GCGCTGCGCG CCGAGGCGTT GGAAGAATGG 
CGCGCAGCGC TCAGCCGATA A

Protein sequence

MKSLIFASAT CLATAVAAAD TPELVVYTYD SFVSEWGPGP AVEEAFEAVC GCDLKFVGAG 
DGAALLARIK LEGARSDADV VLGLDTNLTA AAKETGLFAP VSVEADYALP ITWSDTHFAP 
YDWGYFAFVH NADVPAPSNF EALADSDLKI VIQDPRSSTP GLGLLMWVKA AYGEDAPALW 
EGLSDNIVTV TKGWSEAYGL FLEGEADMVL SYTTSPAYHL IAEEDDSKSA ALFDEGHYMQ 
VEVAGKLAAS DESALADQFL EFMVSDAFQS IIPTTNWMYP AVTPDSGLPQ GFETLISPEK 
SLLLPEDEAA ALRAEALEEW RAALSR