Gene Caul_5080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5080
Symbol
ID	5897428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	+
Start bp	184
End bp	1437
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	68%
IMG OID	641555183
Product	peptidase S10 serine carboxypeptidase
Protein accession	YP_001676514
Protein GI	167621729
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2939] Carboxypeptidase C (cathepsin A)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000112364
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0461552
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGAGAC CCTGGCGCGC CGGCGCGGCG ATCATGGCCC TGGCGCTTTG TAGCGGCCTG 
GCCTGGGCTG GCGAGCCGAA CAAGCCCGGC GTGGTGGAGG CCGCTGGCCA AACGGTGCGC 
TATGTCGCGC GCCTGGACGA AACGGTGCTG ACCAAGGCCG ACGGCGCGCC CGAAGCACGC 
CTCATCACGC CAGTCTACGA GCGCGCCGGC CCGCGCGCGC GCTCCCGCCC CGTTCTCTTT 
GCCTTCAACG GCGGGCCCGG TTCCTCAAGC GTCTATCTGC ACCTGGGCGT TCTGGGCCCA 
CGACGTCTCG ATCTGCCAGG CGACGCCTCG CCGCCCGCCC CGCCCTACCG AATGGTCGCA 
AACGCCGAGA CGGTGCTGGA CACCGCGGAT CTGGTGCTGA TCGATCCGGT CGGGACGGGC 
TTGAGCCGCC TGCTCGATCC AGGCCAGCAT GCGGCCTACT ACTCCGTGGA CGGCGAGGGC 
CGCTATCTGG CGCGTTTCAT TCGCCAGTGG TTGGCCCAGC ATGGCAGGAC CGACGCGCCG 
GTGTTTATCC TGGGCGAGAG CTACGGGGCC ATGCGAGCGG TGGCCATCAC CAAGCACCTG 
ATCCTGGATC CCGGACCGAC GGTTGATCTT CGGGGGCTGA TGCTGGTGTC GCAAAGCATC 
GGCGTGCATG AGACGGTTCA ACGTCGCGGA AACCTTGTGG GCCAGGCCGT AGCGCTGCCC 
ACATTGGGCG CGATCGCCTG GTATCATCAT CGCGCCCAGA CCGAGGGGCT GGACCTGCAG 
GCCTTTCTCG ACAAGGTCCA GGCCTTCGCC ACCGACGACT ACCTACCTGC GCTCTATGCC 
GGCAATGGGC TGCCTGCGGC CCGCCGCGAA GCGATCGCCG ACGTGCTTGC CCGCTTGACG 
GGCGTCTCGG CCAAGACCTG GCTGGCCAAT GACCTGCAGA TCTCCAAGGA AGCCTATCGG 
CGCCTGATCC TGGCTGACCA GGGCCAGCAG GTTGGCCGCA ACGACGCACG GTTCACCGGG 
CCGCTCGGTG GCGAGGACCC GTCTACAAAA GGACTGACCC AGGCGCACGC CTGGGCCATC 
GACCAGGTGC TTGGCCAGGA GTTTGGCGCC AGCGCCAAAG ATTATCGCGT CAGTGACGAT 
CCCCAGCCCA GCCGATGGAT CTACGCGCGC GACCAAGGCC AGCGCCAAGC CGGCGCAGGC 
GATCGCGTCG ATCCGGCTTG GGGCGCGGTC TTTGGCCTAC CGGGCCTTCG TTGA

Protein sequence

MTRPWRAGAA IMALALCSGL AWAGEPNKPG VVEAAGQTVR YVARLDETVL TKADGAPEAR 
LITPVYERAG PRARSRPVLF AFNGGPGSSS VYLHLGVLGP RRLDLPGDAS PPAPPYRMVA 
NAETVLDTAD LVLIDPVGTG LSRLLDPGQH AAYYSVDGEG RYLARFIRQW LAQHGRTDAP 
VFILGESYGA MRAVAITKHL ILDPGPTVDL RGLMLVSQSI GVHETVQRRG NLVGQAVALP 
TLGAIAWYHH RAQTEGLDLQ AFLDKVQAFA TDDYLPALYA GNGLPAARRE AIADVLARLT 
GVSAKTWLAN DLQISKEAYR RLILADQGQQ VGRNDARFTG PLGGEDPSTK GLTQAHAWAI 
DQVLGQEFGA SAKDYRVSDD PQPSRWIYAR DQGQRQAGAG DRVDPAWGAV FGLPGLR