Gene CPR_2539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2539
Symbol	pepP
ID	4204058
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2761707
End bp	2762951
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	28%
IMG OID	642567089
Product	xaa-pro aminopeptidase
Protein accession	YP_699786
Protein GI	110801641
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGTT TAGTTTTTAC TAAAAACAGA GAGAATTTAT TAAAGAAACT AGAAGACAAT 
TCATTATTAG TTTTATTTGC AGGAGAGGCT AAAAGAAAAA CAGCAGATGA ATATTTTCCA 
TTTACTCCAA ACAGAAATTT TTATTATTTA ACAGGAGTGG ATGAAGAAAA GCATATACTA 
ATGATAAAGA AAATAAATGG TGTGGTTGAT GAAGTCCTTT ATATACTAAA ACCAAATTTA 
GAGCAAGAAA GATGGACTGG AAAGACTATA AGAGATTATG AAGCTAAAGA AGTATCTGGC 
ATAGAAAATA TAAAATATTT AGAAGAGTTT AAAAGTGATT TAAATATGAT TTTTACTAAT 
GGAATTGCAG AAAATCTTTA TTTAGATTTA GAAAGAGTTT CATTTGATGA AGAAATGAGT 
AAAAGTCAAA GTTTTGCAAA GGAAATTAAG GAGAGATATC CTCAAGTAGT TATAAAAGAT 
GTTTATTCTG ATATAGCTTC CTTAAGACAA ATTAAATGTA AAGAAGAAGT AGAAGAAATA 
AAGAAGGCTG CTCACATAAC AGCTAAAGGT GTAGAACTTT TAATGAAAGA ATGTAAGCCT 
GGAATGAAAG AATATGAATT AGAAGCATAT TTTGATTTTT ATTTAAAACA AAATGGAGTT 
AAAGATTATG CTTTTAAAAC TATAGCAGCT GCTGGCGTAA ATGCTGCTAC TTTACATTAC 
GTTGATAATA ATAGTGAAAT AAAAGATGGA GACTTAATTC TTTTTGATTT AGGGGCTCAA 
GTAAATTATT ATAATGGAGA TATTTCAAGA ACATTCCCTG CTAATGGTAA GTTTACTAAG 
AGACAAAAAG AGGTTTATGA AGAAGTTTTA AAAGTAAATG AAGAGATAAT AAACTCTATT 
AGACCAGGGG TTGGATTCTA TGAAATAAAT GACAAAGCAA ATAATCTTTT AGCTGAAGCT 
TGTGTAAGAT TAGGTCTTAT AGAGGACAAA AAAGATTATA GAAAGTATTA TTTCCACTCA 
ATAGGACATA GTTTAGGTCT TGACACTCAT GATGTTGGTA AGAGAGATAT CATTCTTGAA 
GAAGGTATGG TTTATACTGT AGAGCCAGGA TTATATATTG AAGAAGAAGC TATAGGAATA 
AGAATAGAGG ACGATGTTTT AGTTACTAAA GATGGATGTG AAGTTTTAAC AAAAGAATGC 
ATTAAGTCTG TAGAAGATAT AGAAAAGTTC ATGAGTAATA GATAA

Protein sequence

MKSLVFTKNR ENLLKKLEDN SLLVLFAGEA KRKTADEYFP FTPNRNFYYL TGVDEEKHIL 
MIKKINGVVD EVLYILKPNL EQERWTGKTI RDYEAKEVSG IENIKYLEEF KSDLNMIFTN 
GIAENLYLDL ERVSFDEEMS KSQSFAKEIK ERYPQVVIKD VYSDIASLRQ IKCKEEVEEI 
KKAAHITAKG VELLMKECKP GMKEYELEAY FDFYLKQNGV KDYAFKTIAA AGVNAATLHY 
VDNNSEIKDG DLILFDLGAQ VNYYNGDISR TFPANGKFTK RQKEVYEEVL KVNEEIINSI 
RPGVGFYEIN DKANNLLAEA CVRLGLIEDK KDYRKYYFHS IGHSLGLDTH DVGKRDIILE 
EGMVYTVEPG LYIEEEAIGI RIEDDVLVTK DGCEVLTKEC IKSVEDIEKF MSNR