Gene Caci_1352 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_1352
Symbol
ID	8332690
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	1539956
End bp	1540894
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	69%
IMG OID	644954500
Product	proline iminopeptidase
Protein accession	YP_003112116
Protein GI	256390552
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.800954
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCCTT ACGCCACCGG ATTTCTCGAC GTCGGCGACG GGAATCGGAT TTACTACGAA 
GAACTCGGCA ACCCCGACGG CAAGCCGGCG GTGAACCTGC ACGGCGGTCC CGGCAGCGGC 
TCGATGAAGC GCCCGACCAA GGCCTGGGAC CCCGAGAAGT GGCGCGTCAT CCGCTTCGAC 
CAGCGCGGGT GCGGGCTCAG TACGCCCAGC GCCGCCGACC CCGCGACGGA CATGTCCGTC 
AACACCACGC AGCACCTCAT CCGCGACATC GAGCTTCTGC GCGAGCATCT GGGTATTGAG 
AAGTGGCTGG TGAAGGGCGG CTCGTGGGGT GCCGCCCTGG CCCTGCTCTA CGCGCAGGCG 
CACCCCGAGC GCGTCACCGA GATGATCATC CCGGCGGTCA CCACGACCCG TCCGGAGGAG 
ACCGACTGGC TGTACCACGG CGCCCGCCGC CTGTTCCCCG AAGCCTGGGA CCGCTTCCGC 
AACCATGTGC CGGAGGACGA GCGCGACGGA AACCTGCTCC TGGCATACGG ACGCCTGGTA 
GCGAACCCGG ACCGCGCGGT GCGCGAAGCC GCGGCGGCGG AGTGGATGAG GTGGGAGGAC 
ACCTTGATCT CCCAGGAATC CAACGGCAAG CCCGGCTCCT ACAGCGCGGT GGTCGACGAC 
GACCGGGTGG CCTTCGTCCG CATCTGCGCG CACTACTTCG GCAGCGACGC CTGGCTGGAG 
CCGGACCAGG TTCTGCGCAA CGTCGACAAG CTGCGCGGCA TCCCGGCGGT CCTCGTCCAC 
GGCCGCCACG ATCTGGGCAG CCCGGTCTAC ACCGCCTGGG AGCTGGCGCA GGCGTGGCCG 
GACGCGAAGC TGGTGATCAT CGAGGACTCC GGGCACACCG GCAGCGAGGC GATGGGGCAG 
GCGCTCAACG AGGCGGCGGA GGAGTTCTCG AAGCGATAG

Protein sequence

MGPYATGFLD VGDGNRIYYE ELGNPDGKPA VNLHGGPGSG SMKRPTKAWD PEKWRVIRFD 
QRGCGLSTPS AADPATDMSV NTTQHLIRDI ELLREHLGIE KWLVKGGSWG AALALLYAQA 
HPERVTEMII PAVTTTRPEE TDWLYHGARR LFPEAWDRFR NHVPEDERDG NLLLAYGRLV 
ANPDRAVREA AAAEWMRWED TLISQESNGK PGSYSAVVDD DRVAFVRICA HYFGSDAWLE 
PDQVLRNVDK LRGIPAVLVH GRHDLGSPVY TAWELAQAWP DAKLVIIEDS GHTGSEAMGQ 
ALNEAAEEFS KR