Gene Caul_5367 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5367
Symbol
ID	5897232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010333
Strand	-
Start bp	77675
End bp	78931
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	71%
IMG OID	641550659
Product	conjugation TrbI family protein
Protein accession	YP_001672145
Protein GI	167621637
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2948] Type IV secretory pathway, VirB10 components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.196515
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.456411
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCATC TCCCCCCAGA TCCGCCGCTT GATGGGCGGC CGTCTTACGA GCCCGAACGC 
AAGGCCAGCT CGGCGAGCGT GCTCAGCGCA CCCAGGTTCC CGGTCACCCG CTGGAACCGC 
AAGTATCTGA TGGCCGGAGC CGCCGTCCTG GCCAGCATCG TGGCCGGCGG ATTCTACCTG 
GGCTTTGGCG GGGCGCACGC CACCAAGGGC CGGCCCGACG ATTCGCAGAA CGCCGCTGAC 
ACATCGAGCC CGCAGACGCC GGAGATCGCC ACCCGCTATG CTGCTGGCTA CGCCGATCCG 
GCGGTGCGGC CGGGCACGAC CAGCTTGCCG CCGCCGGACG CGCTTGCGCC CCCTGCCCCG 
ACGACGCAGG CCGCTGGCCA GCCCGGCCAA CCGGCGCCGG TTGATCCCGC CGTTCAGGCG 
GCGCGCGAGC AGGCGCTGGC CGCTCGCTCG GCCAGCCCGT TCTTCGGCGG CGCCCAGGCT 
CAGCCGCAGG CCGCCTCCCA AACTGGCCCT TTGGCCCCCG ATCCGGGGCC GATGCTGGCA 
GCGGCCCTGG TGCCTGGCTT CGGCACGCCG CCCGCGTCGG CGGCCGGCGA CGTGCAGCCG 
GCCAATGGCC AGGCCGGCAA GCGTCAGTTC GCGGCCGGCG CCAGGGTCGA TGACTATCTA 
ACGAGCCCCC TGCAGGCGCC GATCAGTCCT TGGGAGGTCA AGGCCGGCAC GATCATCTCG 
GCCGCCCTGA TCACGGCGAT CAATTCCGAT CTGCCGGGCC AGGTGATCGC CCAAGTCACC 
GAGCCAGTGT ACGACCACAG GACCGGGCGC ACGGTGCTCA TCCCTCAGGG CTCGCGGCTG 
ATCGGCCAAT ACGACAGCCA GGTCGCCCAC GGCCAAAGCC GCTCGCTGAT CGCCTGGAAC 
CGGGTGATCA TGCCCGACGG CCGTTCGATC AACATCGGCT CGATGGCCGG CGCCGATCTC 
TCCGGCGCGG CCGGGCTGCA GGACAAGACC GATGGTCACT TCTGGCAACT GGCTCGCGGC 
GTGGCGCTCT CGACGGTGTT CTCCGTCGGC GCGGCGGCGG CGCAAGACGC CGGAACCCGC 
AGCTCCGGCG GTCTTGTGAT CAACAGCGCC GGCAGCGGGA TTTCCACTTC CGCCCAGCAG 
GTCGGCCAGC AGGTCACCGC TCGCGACCTC AACCGGCAGG CCACCTTGCG GATCCGGGCC 
GGGTGGCCGC TCCGGGTCAT CGTCAACAAA GACATGATCC TGGCCCCCTA CCCCTAA

Protein sequence

MRHLPPDPPL DGRPSYEPER KASSASVLSA PRFPVTRWNR KYLMAGAAVL ASIVAGGFYL 
GFGGAHATKG RPDDSQNAAD TSSPQTPEIA TRYAAGYADP AVRPGTTSLP PPDALAPPAP 
TTQAAGQPGQ PAPVDPAVQA AREQALAARS ASPFFGGAQA QPQAASQTGP LAPDPGPMLA 
AALVPGFGTP PASAAGDVQP ANGQAGKRQF AAGARVDDYL TSPLQAPISP WEVKAGTIIS 
AALITAINSD LPGQVIAQVT EPVYDHRTGR TVLIPQGSRL IGQYDSQVAH GQSRSLIAWN 
RVIMPDGRSI NIGSMAGADL SGAAGLQDKT DGHFWQLARG VALSTVFSVG AAAAQDAGTR 
SSGGLVINSA GSGISTSAQQ VGQQVTARDL NRQATLRIRA GWPLRVIVNK DMILAPYP