Gene Smed_2627 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2627
Symbol	tolB
ID	5323496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2727533
End bp	2728843
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	62%
IMG OID	640791571
Product	translocation protein TolB
Protein accession	YP_001328292
Protein GI	150397825
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0823] Periplasmic component of the Tol biopolymer transport system
TIGRFAM ID	[TIGR02800] tol-pal system beta propeller repeat protein TolB

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAATGC TGAGACGCAA TTTTTTCCGC CTTCTGATGG TGCTGGTCGC AGGCTGCGGG 
CTCATTGCCT CGCCGGCAAA GGCGCTCGTC GAGATCGACA TCAACAAAGG TAACGTCGAG 
CCGCTGCCGA TCGCGATCAC GGATTTCGTG CAGGGCGAGC TTGCGCAGAA GATATCCGAC 
GTCATTGCCG CCGATCTGAA GCGCTCCGGG CTTTTCGCTC CCATCAACAA GGGCGCGTTC 
ATCGAGAAGG TCTCCAATCC CGATGCCACT CCGCGCTTCG AGGACTGGAA GGTCATCAAC 
GCGCAGGCGC TCGTCATTGG TCGCGTCACA AAAGAAGGCG ACGGCAGGCT GAAGGCGGAG 
TTCCGCCTCT GGGATACCTT CGCCGGAACG CAGATGCTGG GTCAGCAGTT CTACACCCAG 
CCGGAAAACT GGCGCCGGGT CGCCCACATC ATCGCCGATG CGATCTATGA AAGGATCACG 
GGCGAGAAGG GCTATTTTGA CACGCGCATC GTCTATGTCG CCGAAAGTGG TCCGAAAAAT 
GCGCGCCAGC GCCAGCTGGC CATCATGGAC CAGGACGGGG CCAATTCCCG CGCGCTCACC 
AATTCCAATG ACATCGTGTT GACGCCGCGC TTCTCGCCGA ACCGCCAGGA AATCACCTAT 
ATGTCGTTCG AGAACCAGCA GCCACGGGTC TATCTGCTGC AGCTGGAAAC GGGGCAGCGC 
GAGGTGGTCG GCAACTTCCC GGGCATGACC TTCGCTCCAC GCTTTTCGCC GGACGGCCAG 
CGGGTGATCA TGAGCCTGCA GCAGGAAGGC AACGCCAATA TCTATACGAT GGACCTGCGC 
TCGCGCACGA CGACGCGGCT CACCAACACC GCGGCGATCG ACACCTCGCC GTCCTATTCG 
CCGGACGGAA GCCGGGTCGT TTTCGAAAGT GATCGCGGCG GCAGGCAGCA GCTCTATGTC 
ATGGGTGCCG ATGGCTCGGG CCAGACGCGC ATCTCCTTCG GCGACGGTTC CTATTCGACG 
CCGGTCTGGT CCCCGCGCGG CGATCTCATC GCCTTCACCA AGCAGTCGGG TGGGAAGTTC 
TCGATCGGTG TCATGAAACC GGACGGCTCG GGTGAGCGTA TCCTCACGAC AGGCTTCCAT 
AATGAAGGTC CCACCTGGGC GCCGAACGGC CGCGTGCTGA TGTTCTTCCG CCAGAACGCC 
GGCGCAGGCG GCCCACAGCT CTATTCGATC GACCTGACGG GCTATAACGA GCAGCTTGTC 
CCGACCCAGG GCTTCGCCTC GGACCCGGCC TGGTCGCCGC TCATGGAGTA G

Protein sequence

MEMLRRNFFR LLMVLVAGCG LIASPAKALV EIDINKGNVE PLPIAITDFV QGELAQKISD 
VIAADLKRSG LFAPINKGAF IEKVSNPDAT PRFEDWKVIN AQALVIGRVT KEGDGRLKAE 
FRLWDTFAGT QMLGQQFYTQ PENWRRVAHI IADAIYERIT GEKGYFDTRI VYVAESGPKN 
ARQRQLAIMD QDGANSRALT NSNDIVLTPR FSPNRQEITY MSFENQQPRV YLLQLETGQR 
EVVGNFPGMT FAPRFSPDGQ RVIMSLQQEG NANIYTMDLR SRTTTRLTNT AAIDTSPSYS 
PDGSRVVFES DRGGRQQLYV MGADGSGQTR ISFGDGSYST PVWSPRGDLI AFTKQSGGKF 
SIGVMKPDGS GERILTTGFH NEGPTWAPNG RVLMFFRQNA GAGGPQLYSI DLTGYNEQLV 
PTQGFASDPA WSPLME