Gene CPF_0866 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0866
Symbol
ID	4202019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1029967
End bp	1031742
Gene Length	1776 bp
Protein Length	591 aa
Translation table	11
GC content	31%
IMG OID	638081749
Product	M24 family metallopeptidase
Protein accession	YP_695316
Protein GI	110800352
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.23062
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGTGA CTGAAAGATT AGAAAAATTA AGAAAAATTA TGAAGGATAA AGGAATTGAC 
TATTATATAA TTCCTAGTGA GGATGCTCAT CAAAGTGAAT ATGTATGCGA ACATTATAGG 
GGGAGAGCAT ATATGTCAGG TTTTACAGGG TCAGCAGGAA CTTTACTTGT TGGTTTAGAA 
AATGATATTT TGTGGACTGA CGGTAGATAT TTCATACAAG CTTTAGAGGA GTTAAAGGGT 
TCTGGAATTG AAATGTTTAA AATGAGAATT CCAGGATGGC CAAGCTTATT AGAATGGCTT 
AAAGAAAATG CAAAGGCAGG AGAAACTATT GCTTTTGATG GAAAGGTATT TTCCGTAGGA 
GAATATAAAG ATTTTAAAAA ATTAGAGAAA GAAAATAATA TTAATATAAA AATAGATGAG 
GACCTTTTAG ATGAGGTTTG GAAAGAGAGA CCATCTCTTC CTAAGGAAAA GGCATTTTTA 
CATGAAGTTA AGTACTGTGG AAAAAGTGCG AAAGAAAAAT TAAGAGAAGT TAGAGAGGAA 
ATGAAAAAGC TAGGCGCTAA TAATTATATT ATAGCTTCTT TAGATGACAT AGCTTGGCTT 
TATAATATTA GAGGAAATGA TGTTAAATGC AATCCTGTAG TTTTAAGCTA TGCCTTAGTT 
AAAGAAAATG AAGCATATCT TTATGTAGAT AAATCAAAGT TCACTTCTAA AATGGAGGAA 
GAACTTTTAA ATGAAGGGGT AACTTTAAAA TCATATGAGA AAATTGGAGA GGATATTAGT 
AATTTAGAAG GAAAGATTTT AATTGATCCA AATAAGATAA GTGCTTATTT ATACGAGTGC 
ATTAAGGATA AAAATAATAT TGTGGAATTT GGAAACATAA CAACTAAGTT TAAGGCTATT 
AAGAATGAAG TTGAATTAGA TAACTTAAGA AAGTGTCAAG TTAGAGATGG ATTAGCTATG 
GTTAAGTTTA TGAAATGGCT TAAGGATAAC ATTGGAAAGA TAGAAATAAG TGAAATATCA 
GCTTCAGATA AGTTAGAAGA GCTTAGAAGT TTAGATAAGT TATTTAAAGG AATTAGTTTT 
GAAACTATAG CAGGGCATAA AGAACATGGT GCTATGATGC ATTATTCAGC AACTAAAGAG 
AGTGATTACA CTTTAGAACC AAGAGGATTT TTATTAATAG ATTCAGGTGG ACAATACTTA 
GATGGAACTA CAGATATAAC AAGAACTTTT GTTTTAGGAG AATTAACTGA GGAAGAGAGA 
AAAGATTATA CTCTAGTTTT AAAAGGGCAT ATAGGCCTTA TGAGAGCTAA ATTCTTAAAG 
GGAACAACTG GATCAGCCCT TGATATAAAA GCTAGAGAAC CATTATGGAA TGAAGGAATT 
GATTATAAAT GTGGAACAGG TCATGGAGTT GGATTTTTCT TAAATGTTCA TGAAGGACCA 
CAAAGCATAA GTCCAGTACC AAATAAGGTT GCCTTAGAGC CAGGAATGAT TATAACTAAT 
GAACCTGGAG TTTATAGAGA AGGAAAACAT GGAATAAGAA CAGAGAATAC AATGGTAGTT 
GTTAAAGATA CTTATTCAGA AGAGTTTGGA GAATTTTATA AGTTTGATAC TATTTCACTT 
TGTCCAATAG ATTTAGAAGG ATTAGATATA AGCTTATTAA ATGAAGAGGA AAAGGATTGG 
CTAAATAATT ATCATAAAAA GGTTTATGAT TTATTATCAC CATATTTAGA TGAAGAGGAA 
AAAGAATTAT TAAAGAATGA AACAAGGGAA ATATAA

Protein sequence

MKVTERLEKL RKIMKDKGID YYIIPSEDAH QSEYVCEHYR GRAYMSGFTG SAGTLLVGLE 
NDILWTDGRY FIQALEELKG SGIEMFKMRI PGWPSLLEWL KENAKAGETI AFDGKVFSVG 
EYKDFKKLEK ENNINIKIDE DLLDEVWKER PSLPKEKAFL HEVKYCGKSA KEKLREVREE 
MKKLGANNYI IASLDDIAWL YNIRGNDVKC NPVVLSYALV KENEAYLYVD KSKFTSKMEE 
ELLNEGVTLK SYEKIGEDIS NLEGKILIDP NKISAYLYEC IKDKNNIVEF GNITTKFKAI 
KNEVELDNLR KCQVRDGLAM VKFMKWLKDN IGKIEISEIS ASDKLEELRS LDKLFKGISF 
ETIAGHKEHG AMMHYSATKE SDYTLEPRGF LLIDSGGQYL DGTTDITRTF VLGELTEEER 
KDYTLVLKGH IGLMRAKFLK GTTGSALDIK AREPLWNEGI DYKCGTGHGV GFFLNVHEGP 
QSISPVPNKV ALEPGMIITN EPGVYREGKH GIRTENTMVV VKDTYSEEFG EFYKFDTISL 
CPIDLEGLDI SLLNEEEKDW LNNYHKKVYD LLSPYLDEEE KELLKNETRE I