Gene CPF_2239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2239
Symbol
ID	4202973
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2485767
End bp	2486924
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	33%
IMG OID	638083104
Product	putative amidohydrolase
Protein accession	YP_696663
Protein GI	110800196
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0161054
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAATTA AAAATGGGAA AATATTTACC TGTGAAGAAG GTAAGATATA TGAAAAAGGT 
GATATTCTAA TTAAGGATGG AAAGATAAGT AGAATTGGGG AAGATTTAAG TCAATACATA 
GGAGAAGAAG AGGTTATTGA TGCTAAAGGA CTATTAATAT TTCCAGGGTT TATTGAAGCA 
CATTGTCATT TAGGACTACA TGAAGAAGGA AATAATGGGG CAGGAAATGG AACCAATGAA 
GCTAGTGAGC CTATAACCCC ACAAATGAGA GCTATAGATG GAATAAATCC CTTTGATGGA 
GGATTCCAAT CTGCAATGGA AGCAGGAGTT ACCACAGCTG TAATTGGGCC TGGAAGCGCT 
AATGTAATAG GAGGACAGTT TGCCGCTGTA AAAACAAGTG GAATATGTAT TGATGACATG 
ATAATAAAGG AACCTGTAGC AATAAAGGTT GCCTTTGGAG AAAATCCAAA AAGAGTTTAT 
TCTGGAAAGA ATAAAATGCC TAATACAAGA ATGGCTATTG CAGCTTTATT AAGAGAAACT 
TTAACAGAGG CTGTTAATTA TAAAAATAGA AAAATTGATG CTGAAATAGA GGATAGGGAT 
TTTAGTAAGA ATTTAAAATA TGAGGCTTTA CTTCCCTTAA TTAATAGAGA AATACCTATG 
AAAGCTCATA CCCATAGGGC AGATGATATT TTAACTGCCA TAAGAATAGC TAAGGAATTT 
AATCTTAAAT TAACTTTAGA TCACTGTACA GAAGGACATT TAATAAGTGA TTATATTAAA 
AGAGAAAACT TAGATGCTAT AGTTGGGCCA ACTTTAAGTT TTAATGGAAA GGCTGAGACT 
TTAAATAAGA CCTTTAAGAC TCCAAAGGCC TTAATAGATA AAGGAATTAA AGTAGCAATA 
ACTACAGACC ATCCAGTGGT AACAATAGAC AATCTTCCAC TTTGTGCAGC TATGGCTATG 
AAAGAAGGAA TTACTTTTAA TGAGGCCTTA GAAGCAATAA CAATAAATCC AGCTGAAATA 
ATAGGTATTG ATGAAAGGGT TGGAAGCTTA AAGGAAGGAA AGGATGGAGA TTTAGTAATT 
TTAAATGGAA GTCCTTTTGA AATAGCTACA AAAACTATTT ATACAATTAT AAATGGAGAG 
GTAGTTTATA AAGACTAG

Protein sequence

MLIKNGKIFT CEEGKIYEKG DILIKDGKIS RIGEDLSQYI GEEEVIDAKG LLIFPGFIEA 
HCHLGLHEEG NNGAGNGTNE ASEPITPQMR AIDGINPFDG GFQSAMEAGV TTAVIGPGSA 
NVIGGQFAAV KTSGICIDDM IIKEPVAIKV AFGENPKRVY SGKNKMPNTR MAIAALLRET 
LTEAVNYKNR KIDAEIEDRD FSKNLKYEAL LPLINREIPM KAHTHRADDI LTAIRIAKEF 
NLKLTLDHCT EGHLISDYIK RENLDAIVGP TLSFNGKAET LNKTFKTPKA LIDKGIKVAI 
TTDHPVVTID NLPLCAAMAM KEGITFNEAL EAITINPAEI IGIDERVGSL KEGKDGDLVI 
LNGSPFEIAT KTIYTIINGE VVYKD