Gene Caul_1119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_1119
Symbol
ID	5898574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	1184735
End bp	1186657
Gene Length	1923 bp
Protein Length	640 aa
Translation table	11
GC content	69%
IMG OID	641561601
Product	peptidase M61 domain-containing protein
Protein accession	YP_001682747
Protein GI	167645084
COG category	[R] General function prediction only
COG ID	[COG3975] Predicted protease with the C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0159239
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCGAC CTTTATTCCT GTCCCTTGCC TTGGTTCTGT TGGCCGCCGC CACCGCAGCC 
TTCGCCGAAC CCCGGCCCGC GCCGCCGGCC CCGCCGATCC CGGCCGCCCG CGACGTCGCC 
TATCCCGGCG TCATCGACCT GCGGCTCGAC GTCAGCGACA CCACCCGCAA GATCTATCGC 
GTCGTCGAGA CCATTCCGGT CCGCCCCGGC CCGCTGGTGC TGTCCCTGCC CAAGTGGATC 
CCGGGCGAGC ACTCGCCCAG CGCCCAGATC GCCCTGATGT CGGGCTTCAA GGTCACGGCC 
AACGGCAAGC CTCTGGAATG GCGGCGCGAT CCGGTCGAGA TGACCGCGTT CCACCTGGAC 
ATCCCGGCCG GTGTCGAGGC CATCGAGGTT TCGCTGCGAC AGCCCACCGC CCGGCCCGAC 
GGCCCGGTGC GCATCGCCGT GACGCCCAAC CTGCTGATCG TCAAATGGAC CGCCGTGGCG 
CTGTATCCGG CGGGCTACAC TGTCGATCGC ATCCGCGTGC GGCCGTCCCT GACCCTGCCC 
AAGGGCTGGC GGCTGGCCAC CGCCCTGGAC GGCGCGGTGG TCGCCGGCGA CACCAGCGCC 
TTCCCCGAGA CCGACTTCGA GACCCTGATG GACTCGCCGG TCTATGCCGG CCGCAACCTG 
CGAACCTTCG ACCTGGACCC CGGCGGTCGG CGCCCCGTGC GCCTGAACGT CTTCGCCGAC 
GCCGCCTCCA GCCTGGCCGC CAGCGACGCC CAGATCGAGA CCCATCGCGA ACTCATCCGC 
CAGGTCGACA AGCTGTTCGG CGGCGCGCGC AACTACGACC ACTACGACTT CCTGCTCAGC 
CTCAATCCCG ACATCGGCTA TCTGGGCGCC GAGCATCAGC GGTCCAGCGA GAACGGCTAT 
AACGTCGCCG GCTATTTCAC CGACTGGGAC AAGGCCTTCA CCGGCCGCGA TATCCTGGCC 
CACGAATATG TCCACGCCTG GAACGGCAAG CACCGCCGCC CGGCCGACCT GTGGACGCCG 
GACTACACCA CCCCGATGCG CGACAGCCTG CTGTGGGTTT ATGAAGGCCT CACCGAATAC 
TGGGGCGACA TGCTGGCGAC GCGTTCGGGC CTGTTCACGC CCGAGCAGAT GCGCCAGCGC 
CTGGCGCTGA TCGCCGCCAA CGCCCAGGCC ACGCCGGGCC GCGACTGGCG CTCGCTGCGC 
GACACCACCA GCGGCTACAT CATGAACGCC GCCGGCGGCA CGGGCTCGAC CGCCTGGATC 
CGCTCGCTGG ACTATTACGA GGAAGGCCAG CTGCTGTGGC TGGACGTCGA CACCCTGATC 
CGTGAACGGA CGAACGGGTT GAAATCGCTG GACGACTTCG CCAAGGCGTT CTTCGGCGTC 
GATGATGGCG ACATGACCGT GTCGACCTAC ACCTTCGAGG ACGTGGTCGC CGGATTGAAC 
GCGGTGACGC CCTACGACTG GGCGGGCTTT CTGAATGCTC GCCTCGACGC CCACGACAAG 
GCCCCGCTCG ACGGCCTGGC CCGCGGCGGC TGGACCCTGG CGTTCGGCGA CACGCCGACC 
AGCTATTTCA CCGCCTACGA GACGGCCCAG GAAACCCGCC TGTTCACCTT CTCGATCGGT 
CTGGACCTGG ACGAGGACGG GACGGTGAAG GAGTCGCTGT GGGACGGCCC GGCGTTCACG 
GCGGGCATCG TCGCCGGGGC GAAGATCGTC TCGGTCGGCG GTAAGGCCTA TTCCGCCAAC 
CGCCTCGCCT CGGCCATCGC GGCGGCCGCC AAGCCAGGCG CCAGGCCCAT CATCTTGACC 
ATCAAGGCCG ACGGGGTCGT CCGCAAGGTG GATGTGCCGT ACCACGGCGG CCCGCGCTAT 
CCTCGCCTAG AAAAGCTCGC GGGCGCCCAG GACCGGCTCG GCGCGATACT GGCGCCCAGA 
TAG

Protein sequence

MPRPLFLSLA LVLLAAATAA FAEPRPAPPA PPIPAARDVA YPGVIDLRLD VSDTTRKIYR 
VVETIPVRPG PLVLSLPKWI PGEHSPSAQI ALMSGFKVTA NGKPLEWRRD PVEMTAFHLD 
IPAGVEAIEV SLRQPTARPD GPVRIAVTPN LLIVKWTAVA LYPAGYTVDR IRVRPSLTLP 
KGWRLATALD GAVVAGDTSA FPETDFETLM DSPVYAGRNL RTFDLDPGGR RPVRLNVFAD 
AASSLAASDA QIETHRELIR QVDKLFGGAR NYDHYDFLLS LNPDIGYLGA EHQRSSENGY 
NVAGYFTDWD KAFTGRDILA HEYVHAWNGK HRRPADLWTP DYTTPMRDSL LWVYEGLTEY 
WGDMLATRSG LFTPEQMRQR LALIAANAQA TPGRDWRSLR DTTSGYIMNA AGGTGSTAWI 
RSLDYYEEGQ LLWLDVDTLI RERTNGLKSL DDFAKAFFGV DDGDMTVSTY TFEDVVAGLN 
AVTPYDWAGF LNARLDAHDK APLDGLARGG WTLAFGDTPT SYFTAYETAQ ETRLFTFSIG 
LDLDEDGTVK ESLWDGPAFT AGIVAGAKIV SVGGKAYSAN RLASAIAAAA KPGARPIILT 
IKADGVVRKV DVPYHGGPRY PRLEKLAGAQ DRLGAILAPR