Gene CPF_1867 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1867
Symbol
ID	4201240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2100479
End bp	2101804
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	29%
IMG OID	638082737
Product	peptidase, M23/M37 family protein
Protein accession	YP_696301
Protein GI	110798595
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0739] Membrane proteins related to metalloendopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0957526
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAGA GAAAATTAAC TGCAATTATA CTTAGTATAT CAATGATTTT TGCGGTTTCA 
ATAAATAGCA CTAATATTGT ACAAGCTAAG ACTACAGAAG AAGCTCAACA AGAAATTGAT 
AATAATAAAA ATAAAATAGA TGATCTTAAA GATAAACAAA GTGATATAAA TTCTGAGAAG 
AGTAAATCTC AAAGTAAATT AGATGAAATA CAAAAACAAG TAGCTGATAA AAATCAAAAG 
TTACTTACTT CTCAAAAGAA GGTTGATGAA TATAAAGGTA ATATTGACTC CTTAAAGGAT 
AGTATAGATA AACTTCAAGG ACAAATTAAT GATATTCAAA GCAATATAGA TAAGAAGAAA 
AAGGAAGAAG AAGAAAAAGA AGAAATACTT TCAGGTAGAA TAAGAAGTGC TTATAAATCT 
AATTTAAGCA ATCAGTTTTT ATACATAATG CTTGAATCAA AAAATGTAGG GGACTTTATA 
AGTAATGTAT CAAGCATAAA ATATGTAGTG GATACAGATA ATAAGTTAAT TGATGATATA 
AAGAAGGTTC AAAGTGAATT AAAAAGTGAA GAATCTCAAT TAAAAAGTCA AGAAGAAGAC 
TTATCAAGTA AAAAAACTAA GTTAGAAAAT GAGAAGAAAG AATATGATAC CTTAGTAAGT 
CAGTATCAAT CTCAATTAAA TGAATTAAAT TCTTTAGAAG AAGAAAAACA AGCTGAAATA 
AATAGCTTAA GTGAAAAAGA AAGAACAGTA TTAGATGAAA TTAATAGTTA CGAAGAAGAT 
AATGCTAATC TTAAAGATTA TATAAATAAT TTAATCAATG AGAAAAAAAG TGTTAAGGTA 
AATAGTGATA ATAATAGTAA AAGTAGTACA AACAATAAAA GTACAGAGGA ATCAAGCGCA 
TCTAATAATG AGGGAAATTC AGAGACAAAG GCTAATTCCT CAAGTGGATT TATGAGACCA 
GCTCCAGGTG GAGTTACAGA TCCCTTTGGA CCTAGAGTGC ATCCTGTTAC AGGAAAAAGA 
AGTGTTCACA CAGGGGCAGA TTTAGGAGCA TCTTATGGAA CACCTATTCT TGCATCAAAG 
TCAGGTACTG TTGTTGAAGC AGGATGGAAT ACTGCTTATG GTAATATGGT TATAATAGAT 
CATGGAGATG GAACAAGTAC TTTATATGGA CATTCATCTA GACTTGCTGT ACAAGCTGGT 
CAACATGTAT CACAAGGACA AGTAATTGCT TATGTAGGAT CAACAGGATA TAGTACAGGA 
CCTCACCTTC ATTTTGGTAT AATGATAAAT GGTGAATGGG TAAATCCTAT GAATTATATA 
AGTTAA

Protein sequence

MNKRKLTAII LSISMIFAVS INSTNIVQAK TTEEAQQEID NNKNKIDDLK DKQSDINSEK 
SKSQSKLDEI QKQVADKNQK LLTSQKKVDE YKGNIDSLKD SIDKLQGQIN DIQSNIDKKK 
KEEEEKEEIL SGRIRSAYKS NLSNQFLYIM LESKNVGDFI SNVSSIKYVV DTDNKLIDDI 
KKVQSELKSE ESQLKSQEED LSSKKTKLEN EKKEYDTLVS QYQSQLNELN SLEEEKQAEI 
NSLSEKERTV LDEINSYEED NANLKDYINN LINEKKSVKV NSDNNSKSST NNKSTEESSA 
SNNEGNSETK ANSSSGFMRP APGGVTDPFG PRVHPVTGKR SVHTGADLGA SYGTPILASK 
SGTVVEAGWN TAYGNMVIID HGDGTSTLYG HSSRLAVQAG QHVSQGQVIA YVGSTGYSTG 
PHLHFGIMIN GEWVNPMNYI S