Gene Caul_5214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5214
Symbol
ID	5897412
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	-
Start bp	137820
End bp	139046
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	73%
IMG OID	641555317
Product	conjugation TrbI family protein
Protein accession	YP_001676648
Protein GI	167621863
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2948] Type IV secretory pathway, VirB10 components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGCCG CGCGCGACGG CGCGCCAGCC TCTGATCCGC AAGATCTCAG CGCCGCCGCC 
AAGGAGCCGA CGGCCACGGT GCTGCGCGCG CCCCGGCCGC CGATCACGCG TTACCGGCCC 
GCCGTGATCG GCGCGGCGCT GCTGGCGGTG TTGTTGCTGG TGGGTCTCGG CTTCCTGATC 
GCTTTTGGCG GCGGCCACAA GCGCCCGTCG ACCGCCGCCG CAAGCCCGGC GCCCGCCGAG 
CCTGCCACCA CGGCCACGCC GATCGACGAG CGCTTGCCTG CGACCTACGG GGAGCTGGGG 
CCCGCGCCGG CCCCCGCAAG CCTCGCCGCC GCTCCGGGGG CGGCCAGTCC CAGCCAGGAG 
GCCGGCGTCA CGACCAGCAG CGGCGCTTCG ACCGGCGGTG ACGGCGGCGC GCGACAGCGA 
CAGCTTGAAG ACCAGCGCGC CGCGCAAGGC TCGGCGCCGT TCTTCGGCGG CGCGGCCGGA 
TCGACCGCCC AGGCCGCGGC CGCGCCGAGC CTGCCCCCGC TGGCCTTCGC CGGACCGGAG 
GCCGCCCCCA CCCCGGCCGC CGGCCTCAGC GCCAAGGAGG GGTTCATCGC CCGGGCCTCC 
GCGCCCCAGG CCAACTACGC GCCGGGTTTG CCCCAACCAC CCCTATCGCC TTACGAGGTC 
AAGGCCGGCT CCGTGATCGC CGCGGCCCTG GTCACCGGAC TCAACTCCGA TCTGCCCGGC 
ATGGTCGTGG CCCAGGTCAC CCAGCCGGTG TTCGACCACG CCACGGGCCG TGTCATGCTC 
ATTCCCCAGG GCGCGCGCCT GATCGGCAAG TACGACAGCC AGGTCGGTTA TGGGCAGGAC 
CGGGTGCTGC TGGTCTGGAC TCGGCTGATC TATCCCAGCG GCCGGTCGGT GGACCTTGGC 
GCGATGACCG GGGCCGATGT CACCGGGGCC GGCGGACTAT CGGACCGCAC CGACACCCAC 
CTTCCGGTGC TGGCGCGGGC CATTGGTCTT TCGACCCTGA TCTCGATCGG CGGCGCGGCC 
GCTCAGAACA GCGTCGCGCG CGGGAGCGAC AACCTGGTCC TGCAAGACGG GGCCGGCGGG 
ATCGCCTCGC AGGCCAGCCA GACGGGCCAG AGGCTCGTCG AGCGCGATCT GCAACGCAAT 
CCGACCTTGC GCATCCGGCC GGGTTTCCCG GTTCGAGTGA TGGTCGACAA GGATCTCATC 
CTGCCACCCG AAGGAGCGCT TCAATGA

Protein sequence

MSAARDGAPA SDPQDLSAAA KEPTATVLRA PRPPITRYRP AVIGAALLAV LLLVGLGFLI 
AFGGGHKRPS TAAASPAPAE PATTATPIDE RLPATYGELG PAPAPASLAA APGAASPSQE 
AGVTTSSGAS TGGDGGARQR QLEDQRAAQG SAPFFGGAAG STAQAAAAPS LPPLAFAGPE 
AAPTPAAGLS AKEGFIARAS APQANYAPGL PQPPLSPYEV KAGSVIAAAL VTGLNSDLPG 
MVVAQVTQPV FDHATGRVML IPQGARLIGK YDSQVGYGQD RVLLVWTRLI YPSGRSVDLG 
AMTGADVTGA GGLSDRTDTH LPVLARAIGL STLISIGGAA AQNSVARGSD NLVLQDGAGG 
IASQASQTGQ RLVERDLQRN PTLRIRPGFP VRVMVDKDLI LPPEGALQ