Gene Caul_5084 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_5084
Symbol
ID	5897334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010335
Strand	-
Start bp	4412
End bp	5914
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	69%
IMG OID	641555187
Product	peptidase S10 serine carboxypeptidase
Protein accession	YP_001676518
Protein GI	167621733
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2939] Carboxypeptidase C (cathepsin A)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.110686
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.189262
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCGCT CTGATCTTTT CGCCCTTGAT CGCCGCGCGC TGATGCTGGC TGGGCTGTGC 
GCGGCCGCGA CCGGTCGGGC TCAAGCCCGT CAAGCCGAGG ATCCCGGCGG CTTCGCCGAC 
GTCGCCAGCC TGTCCTCGAC CGTGACGGGC GAGGGCGTCT TTGGCGGCGC GCCGGTATCC 
TACAGCGCCA GCGTCGCGGC GACGCAGATC CCCAACCCCG CGGGTGGCGC GCCCGGGGCC 
ATGGTGTCCA TCGCCTATGT CCGCACCGAT GTCGCCGATG CGGCGCGTCG GCCGGTCCTG 
TTCTTGTTCA ATGGCGGTCC TGGCGCCTCG ACCACGCCAC TGCATTTCTC CGGCCTGGGT 
CCGTTCACAA GGTTCACGCC GCCCGGCGAT GACAAGGCCC AACTGGCCCC CAACCGTCTG 
TGCCCGCTCG ACTATGTGGA TCTGGTCTTC GTCGATCCGA TTGGCACGGG CTTTAGCCGC 
CCCACCGACC GCGCCTCGGG CAAGGGGTTT TGGACCATGG ACGGGGATGC TGAGTCAGTG 
GCGCGGTTCA TCGAGCTCTG GCTGAAAGCC AACGGCCGCG AGCGCTCGCC GATCTACATC 
TGCGGCGAAA GCTACGGCAC CGCGCGCGCG GCCCTGATGC TGCGCGCGAG GCCGCAAAAT 
CCTTATGCCG GCGTCATCCT GATCTCGCCG GTGATCAACG CCACGGCTAT GACCGTGACG 
CCGGGCAACG ACCTGGCGTT CGTGTTCTGG CTGCCGTCGA TGGCGGCTGT GGCGGCCTAT 
CACGGCCGCG CCGGCGTTAA GGGCGCGGCG GTGTCGGCGC ACTTCCTGGA GGCCGCGCGG 
TTCGCGGGCG GCGACTACGC CAGGGCGCTG TTTCAGGGGG CTGATCTGCC CGCCGATCAG 
GCGCGCGTCG TCGCCAGGCG ACTGGCGGCC CTGACCGGCT TGCCCGCCAA GGAGATCCTG 
GCCCAGAGCC TGAGGATCGA TCCTGACGTC TTCATGCGCC GCCTGCTCGC TGACCAGGGC 
TTGCGCACGG GCCGTCTCGA CGGCCGCGTG ACCGGCCGGC TGGACGCGCC GCCCCGGCCT 
CCGCCCTACA ACGATCCGAG CCTGTCGCCG GGCGGCGACA GCGGCCCGGC GATCGAGGAC 
TATTTCCGCC GACGCCTGGG GGTCTCGACC AAGGCCGCCT ACAAGCGCTT GGCCCTGGAT 
TTCCGCGATG TCTGGGTCAT GGCCTATCCC GAGAGCCTCA AGGACGGCTA CAGCGACGTT 
TCCCAGTTTC TGGGGGCTGC ACTGCGCGCT TCGCCGCACT GCCGTCTTCT GGTGGTCGGG 
GGTTATTTCG ACCTGGCCAC GCCGATCTTC GCGCGCGAGC ACGCGCTGAG CCACGCCGGC 
GCGCCGCGCG GCCAGGTGCA AACGCGCATG TACGCCGCGG GCCACGCGGT GCTGGAAGAG 
CCGGCGGCGC TGGCTTCGTT CGCCGCCGAC CTCAAGGCGA TGATCACGGA GACACAAGCA 
TGA

Protein sequence

MNRSDLFALD RRALMLAGLC AAATGRAQAR QAEDPGGFAD VASLSSTVTG EGVFGGAPVS 
YSASVAATQI PNPAGGAPGA MVSIAYVRTD VADAARRPVL FLFNGGPGAS TTPLHFSGLG 
PFTRFTPPGD DKAQLAPNRL CPLDYVDLVF VDPIGTGFSR PTDRASGKGF WTMDGDAESV 
ARFIELWLKA NGRERSPIYI CGESYGTARA ALMLRARPQN PYAGVILISP VINATAMTVT 
PGNDLAFVFW LPSMAAVAAY HGRAGVKGAA VSAHFLEAAR FAGGDYARAL FQGADLPADQ 
ARVVARRLAA LTGLPAKEIL AQSLRIDPDV FMRRLLADQG LRTGRLDGRV TGRLDAPPRP 
PPYNDPSLSP GGDSGPAIED YFRRRLGVST KAAYKRLALD FRDVWVMAYP ESLKDGYSDV 
SQFLGAALRA SPHCRLLVVG GYFDLATPIF AREHALSHAG APRGQVQTRM YAAGHAVLEE 
PAALASFAAD LKAMITETQA