Gene Caul_4724 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_4724
Symbol
ID	5902186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	+
Start bp	5110719
End bp	5112110
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	68%
IMG OID	641565243
Product	carboxyl-terminal protease
Protein accession	YP_001686342
Protein GI	167648679
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.458117
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0374379
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAAGT ACCTGCTCAT CGGTGTTTCG GCCTTCGTCC TCGGCGCGGG GACCATGGCC 
TACGTCAGCC CCATCGCCCA GGCGAACAGT TCGACCAAGG GCCAGACCTA CAAGATGCTG 
GAGCTGTTCG GCGACGTCCT GCAGACGGTC GACAACCAGT ACGTCTCCGA GGTCGACAAC 
AAGAAGCTGA TCGAGGCGGC CCTCGACGGC ATGCTGACCA GCCTCGATCC GCATTCCGGC 
TACCTGTCGC CCGACAGCTT CGAGGACATG CAGGACACCA CGCGCGGCGA ATATGGCGGC 
CTGGGCATCG AGGTCACCAG CGAGGACGGC GTGGTCAAGG TGATCTCGCC GATCGACGGC 
ACGCCCGCCA TGCGGGCCGG CATCCAGGCC GGCGACTACA TCACTTCGGT CAACGGCCAG 
TCGGTGCTGG GCCTGACCGT CAACGAAGCG GTCAAGCAGA TGCGCGGGCC GGCCGGCGAG 
GCGGTCACCC TGACCATCGC CCGCGACAAG ACCGATCCGT TCGACGTCAA GCTGACGCGC 
GAGGTGATCA AGCCCAAGGC CGCCATCGCC AAGATGGAAG GCGACTACGG CTATGTCCGC 
CTGCCCGGCT TCAACGAGAA GGCCACCGAC GCCCTGACCG CGGCGATCAA CGAGCTGAAG 
ACCAAGAACC CCCACATGAA GGGGCTGATC TTCGACCTGC GCAACAATCC CGGCGGCCTG 
CTCGACCAAG CCGTGGGCGT CTCGGACGTG TTCCTCGATG GCGGCGAGGT GGTCAGCCAG 
CGCGGCCGCG ACCCGCGCGA CATCCAACGC TACAACGCCA AGCCTGGCGA CCTGCTGAAC 
GGCCTGCCGG TGGTGGTGCT GATCAACCAG GGCTCGGCCT CGGCCGCCGA AATCGTCGCC 
GGCGCCCTGC AGGACCGCCA TCGCGCCGAA CTGGTCGGCA TCACCAGCTT CGGCAAGGGC 
TCGGTGCAGA CCGTGATCCC GCTGCGCGGC GGGGCCGACG GGGCCCTGAA GCTGACGACG 
GCGCGCTACT ACACGCCGTC GGGCCGCTCG ATCCAGAAGA CCGGCATCGC GCCCGACCTG 
GAAGTGGCCC AGACCAAGGA CCAGGCTCAG GACATCGCCA ACCGCGTTTG GTTCAGCGAG 
GCCAGCTTCA AGAACGCGCT GAACGCCGAC GAGGGCAAGA CCCGCCAAGG GGTCCACACA 
CCGGCCGAGG CCCCGCCCCC CGGCTTCGAC GACAAGAAGG GCGACTTCCA GCTGGACCGC 
GCCATCGCCG TGCTGAAGGC CGGCTCGGTC CAGGCCGTGC CGAAACTGCC CAAGCCCCAG 
GCCAAGATCG CCGAAGTCAC CGCGAAAGCC GCGGCGGCGG CCGGCAAGGG TCCGCCGGCG 
GTGGAGAAGT AG

Protein sequence

MRKYLLIGVS AFVLGAGTMA YVSPIAQANS STKGQTYKML ELFGDVLQTV DNQYVSEVDN 
KKLIEAALDG MLTSLDPHSG YLSPDSFEDM QDTTRGEYGG LGIEVTSEDG VVKVISPIDG 
TPAMRAGIQA GDYITSVNGQ SVLGLTVNEA VKQMRGPAGE AVTLTIARDK TDPFDVKLTR 
EVIKPKAAIA KMEGDYGYVR LPGFNEKATD ALTAAINELK TKNPHMKGLI FDLRNNPGGL 
LDQAVGVSDV FLDGGEVVSQ RGRDPRDIQR YNAKPGDLLN GLPVVVLINQ GSASAAEIVA 
GALQDRHRAE LVGITSFGKG SVQTVIPLRG GADGALKLTT ARYYTPSGRS IQKTGIAPDL 
EVAQTKDQAQ DIANRVWFSE ASFKNALNAD EGKTRQGVHT PAEAPPPGFD DKKGDFQLDR 
AIAVLKAGSV QAVPKLPKPQ AKIAEVTAKA AAAAGKGPPA VEK