Gene Caul_4427 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4427
Symbol	tolB
ID	5901888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	4796296
End bp	4797621
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	68%
IMG OID	641564945
Product	translocation protein TolB
Protein accession	YP_001686045
Protein GI	167648382
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0823] Periplasmic component of the Tol biopolymer transport system
TIGRFAM ID	[TIGR02800] tol-pal system beta propeller repeat protein TolB

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.500534
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTGA AGTCCGTCTT CACCGGCCCC CTGGCGGCTT GGGCGACAGC CGCCGTCCTG 
GCGCTGTCCA TGGCCGCCCT CGCGCCGACC GTCGCCCGCG CCCAGATCGA GGTCGATATC 
GACAAGGGCG CGGTCAAGCC GCTGCCGGTC GCCATTCCAG CCTTTTCGGG CGGCGGCCGC 
GGCGCCGACA TCGCCCAGGT CATCAGCGGC AATCTCGAGC GCTCGGGGCT GTTCCAGCCG 
CTGAACGTGG CCAATGTCGC CGACAAGCTG GCCGACGTGA ACGTCCAGCC GCGCTTCCCC 
GACTGGCAGG CCACCGGGGC CCAGGCCCTG ATCAACGGCC AGGTGACGGT CGGCGCCGAC 
GGCGTGCTGC GCGTCGACTT CCGCCTGTGG GACACCTTCA GCCAGCAACA GCTTCTGGGC 
CTGCAATTCA CCTCGACCGC CGAGAACTGG CGGCGGGTCG CCCACAAGAT CAGCGACGCG 
GTCTACGAGC GGCTGACCGG CGAGAAGGGC TATTTCGACA CCCGCGTGGT GTTCGTCGCC 
GAGAGCGGCG GCAAGCTGAC GCGCGTCAAG CGTCTGGCGA TCATGGACCA GGACGGCGCC 
AACCCGCAGT ACCTGACCGA CGGCTCCTAC ATCGTCATGA CCCCGCGCTT CTCCTCGACC 
AGCCAGGAGA TTACCTACAT GGCGCTGCGG CCCACCGGGT CGAGCATCTA CCTGACCAAC 
CTGGAGACGG CTCGCACCGA GACCATCGGC AAGTTCCCGG GCATGGTCTT CGCCCCGCGC 
TTCTCGCCGG ACGGCGGCAA GGTGGCCTTC TCGGTCGAGA AGGGCGGCAA CAGCGACATC 
TACGTGATGG ACCTGCGCAG CCGCCAGTCG ACGCGGATCA CCACCGACCC GGCCATCGAC 
ACTTCGCCGT CGTTCTCGCC GGACGGATCG AAGATCGTCT TCAACTCCGA CCGCGGCGGC 
CAGGCCCAGC TCTACATCAT GAACGCCGAC GGCAGCGGCG TGCGCCGCAT CTCGTACGGC 
GGCGGCCGCT ACACCACGCC GGTGTGGAGC CCGCGCGGCG ACTTCATCGC CTTCACCAAG 
CAGACCGGCG GCGAATTCCA CATCGGGGTC ATGAAGGTCG ATGGCGGCGA CGAGCGGCTG 
CTGACCACCA GCTATCTCGA CGAAGGCCCG ACCTGGGCGC CCAACGGCCG GGTGCTGATG 
TTCTCGCGCG AGGGCTCCAG CGGCAATTCG CGGCTCTGGA CGGTGGACAT CACCGGCCGG 
ATCCTGCGCC CCGCCGCCTA TACGGGCGCG GCGTCAGACC CCGCCTGGTC GCCGCTTCTG 
GATTGA

Protein sequence

MNLKSVFTGP LAAWATAAVL ALSMAALAPT VARAQIEVDI DKGAVKPLPV AIPAFSGGGR 
GADIAQVISG NLERSGLFQP LNVANVADKL ADVNVQPRFP DWQATGAQAL INGQVTVGAD 
GVLRVDFRLW DTFSQQQLLG LQFTSTAENW RRVAHKISDA VYERLTGEKG YFDTRVVFVA 
ESGGKLTRVK RLAIMDQDGA NPQYLTDGSY IVMTPRFSST SQEITYMALR PTGSSIYLTN 
LETARTETIG KFPGMVFAPR FSPDGGKVAF SVEKGGNSDI YVMDLRSRQS TRITTDPAID 
TSPSFSPDGS KIVFNSDRGG QAQLYIMNAD GSGVRRISYG GGRYTTPVWS PRGDFIAFTK 
QTGGEFHIGV MKVDGGDERL LTTSYLDEGP TWAPNGRVLM FSREGSSGNS RLWTVDITGR 
ILRPAAYTGA ASDPAWSPLL D