Gene CPF_2854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2854
Symbol	pepP
ID	4201533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	3120233
End bp	3121477
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	29%
IMG OID	638083721
Product	xaa-pro aminopeptidase
Protein accession	YP_697218
Protein GI	110799449
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGTT TAGTTTTTAC TAAAAACAGA GAGAATTTAT TAAAGAAACT AGAAGACAAT 
TCATTATTAG TTTTATTTGC AGGAGAGGCT AAAAGAAAAA CAGCAGATGA ATATTTTCCA 
TTTACTCCAA ACAGAAACTT TTATTATTTA ACAGGAGTAG ATGAAGAAAA GCATATACTA 
ATGATAAAGA AAATAAATGG TGTGGTTGAT GAAGTCCTTT ATATACTAAA GCCAAATTTA 
GAGCAAGAAA GATGGACTGG AAAAACTATA AGAGATTATG AGGCTAAAGA AGTATCTGGC 
ATAGAAAATA TAAAATATTT AGAAGAATTT AAAAGTGATT TAAATATGAT TTTTACTAAT 
GGAATTGCAG AAAATCTTTA TTTAGATTTA GAAAGAGTTT CATTTGATGA AGAAATGAGT 
AAAAGTCAAA GTTTTGCAAA GGAAATTAAG GAGAGATATC CTCAAGTAGT TATAAAAGAT 
GTTTATTCTG ATATAGCTTC TTTAAGACAA ATTAAATGTA AAGAAGAAGT AGAAGAAATA 
AAGAAGGCTG CTCACATAAC AGCTAAGGGT GTAGAACTTT TAATGAAAGA ATGTAAGCCT 
GGAATGAAAG AATATGAATT AGAAGCATAT TTTGACTTTT ATTTAAAACA AAATGGAGTT 
AAAGATTATG CTTTTAAAAC TATAGCAGCT GCTGGAGTAA ATGCTGCTAC TTTACACTAT 
GTTGATAATA ATAGTGAAAT AAAAGATGGA GACTTAATTC TTTTTGATTT AGGTGCTCAA 
GTAAATTATT ATAATGGAGA TATTTCAAGA ACATTCCCTG CTAATGGTAA GTTTACTAAG 
AGACAAAAAG AGGTTTATGA AGAAGTTTTA AAAGTAAATG AAGAGATAAT AAACGCTATT 
AGACCAGGGG TTGGATTCTA TGAAATAAAT GACAAAGCAA ATAATCTTTT AGCTGAAGCT 
TGTGTAAGAT TAGGTCTTAT AGAAGACAAA AAGGATTATA GAAAGTATTA TTTCCACTCA 
ATAGGACATA GTTTAGGTCT TGACACTCAT GATGTTGGTA AGAGAGATAT CATTCTTGAA 
GAAGGTATGG TTTATACTGT AGAGCCAGGA TTATATATTG AAGAAGAAGC TATAGGAATA 
AGAATAGAGG ATGATGTTTT AGTTACTAAA GATGGCTGTG AAGTTCTAAC AAAAGAATGC 
ATCAAGTCTG TAGAAGATAT AGAAAAGTTC ATGAGTAATA GATAA

Protein sequence

MKSLVFTKNR ENLLKKLEDN SLLVLFAGEA KRKTADEYFP FTPNRNFYYL TGVDEEKHIL 
MIKKINGVVD EVLYILKPNL EQERWTGKTI RDYEAKEVSG IENIKYLEEF KSDLNMIFTN 
GIAENLYLDL ERVSFDEEMS KSQSFAKEIK ERYPQVVIKD VYSDIASLRQ IKCKEEVEEI 
KKAAHITAKG VELLMKECKP GMKEYELEAY FDFYLKQNGV KDYAFKTIAA AGVNAATLHY 
VDNNSEIKDG DLILFDLGAQ VNYYNGDISR TFPANGKFTK RQKEVYEEVL KVNEEIINAI 
RPGVGFYEIN DKANNLLAEA CVRLGLIEDK KDYRKYYFHS IGHSLGLDTH DVGKRDIILE 
EGMVYTVEPG LYIEEEAIGI RIEDDVLVTK DGCEVLTKEC IKSVEDIEKF MSNR