Gene SeD_A0844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0844
Symbol	tolB
ID	6873726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	840724
End bp	842019
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	56%
IMG OID	642784039
Product	translocation protein TolB
Protein accession	YP_002214718
Protein GI	198244972
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0823] Periplasmic component of the Tol biopolymer transport system
TIGRFAM ID	[TIGR02800] tol-pal system beta propeller repeat protein TolB

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0211285
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAAGC AGGCATTACG AGTAGCATTT GGTTTTCTGA TGCTGTGGGC GGCGGTGCTG 
CACGCAGAAG TCCGTATCGA GATCACCCAG GGGGTGGACT CGGCGCGACC GATTGGCGTT 
GTGCCTTTTA AATGGGCCGG GCCGGGCGCT GCGCCTGAAG ATATCGGCGG CATCGTGGCG 
GCAGATTTAC GTAATAGCGG TAAATTTAAT CCGTTAGACC GGTCCCGACT GCCGCAGCAG 
CCAGCCACCG CTCAGGAAGT TCAGCCTACC GCATGGTCTG CGCTGGGTAT TGATGCCGTC 
GTCGTTGGGC AGGTAACGCC GAATCCGGAC GGTTCCTACA ATGTTGCTTA TCAGCTGGTT 
GACACTGGCG GCGCGCCGGG GACTGTACTG GCGCAAAATT CTTATAAAGT GAACAAGCAG 
TGGCTGCGTT ATGCAGGTCA TACCGCCAGT GACGAAGTCT TTGAAAAACT GACGGGCATT 
AAGGGCGCGT TCCGTACTCG TATCGCCTAT GTGGTACAGA CTAATGGCGG TCAGTTCCCG 
TATGAACTGC GTGTGTCGGA TTACGATGGT TACAATCAGT TTGTGGTGCA CCGTTCTCCG 
CAGCCGTTGA TGTCTCCGGC GTGGTCTCCG GACGGCTCAA AACTGGCTTA CGTGACATTT 
GAAAGCGGTC GCTCCGCGCT GGTTATCCAG ACGCTGGCAA ACGGCGCAGT GCGTCAGGTT 
GCGTCCTTCC CGCGTCACAA CGGCGCGCCG GCCTTCTCGC CGGATGGGAC GAAACTGGCG 
TTCGCGTTAT CGAAAACCGG AAGTCTGAAC CTGTACGTTA TGGATCTTGC TTCCGGCCAG 
ATTCGTCAGA TAACGGACGG GCGTAGCAAC AATACGGAGC CGACCTGGTT CCCGGACAGC 
CAGACTCTGG CCTTTACCTC TGACCAGGCT GGACGTCCGC AAGTGTATAA AATGAACATT 
AACGGCGGTG CGGCGCAGCG TATTACCTGG GAAGGTTCGC AAAACCAGGA TGCGGATGTC 
AGCAGCGACG GTAAATTTAT GGTAATGGTA AGCTCAAATA ACGGGCAGCA GCACATTGCC 
AAACAAGATC TGGTGACGGG TGGCGTACAG GTTCTGTCGT CAACGTTCCT GGATGAAACG 
CCAAGTCTGG CACCTAACGG CACGATGGTA ATCTACAGCT CTTCTCAGGG GATGGGATCT 
GTGCTGAATT TGGTTTCTAC AGATGGGCGT TTCAAAGCGC GTCTTCCGGC AACTGATGGT 
CAGGTGAAAT CGCCTGCCTG GTCGCCGTAT CTGTGA

Protein sequence

MMKQALRVAF GFLMLWAAVL HAEVRIEITQ GVDSARPIGV VPFKWAGPGA APEDIGGIVA 
ADLRNSGKFN PLDRSRLPQQ PATAQEVQPT AWSALGIDAV VVGQVTPNPD GSYNVAYQLV 
DTGGAPGTVL AQNSYKVNKQ WLRYAGHTAS DEVFEKLTGI KGAFRTRIAY VVQTNGGQFP 
YELRVSDYDG YNQFVVHRSP QPLMSPAWSP DGSKLAYVTF ESGRSALVIQ TLANGAVRQV 
ASFPRHNGAP AFSPDGTKLA FALSKTGSLN LYVMDLASGQ IRQITDGRSN NTEPTWFPDS 
QTLAFTSDQA GRPQVYKMNI NGGAAQRITW EGSQNQDADV SSDGKFMVMV SSNNGQQHIA 
KQDLVTGGVQ VLSSTFLDET PSLAPNGTMV IYSSSQGMGS VLNLVSTDGR FKARLPATDG 
QVKSPAWSPY L