Gene CPR_2216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2216
Symbol	pepD
ID	4205672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2448639
End bp	2450090
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	30%
IMG OID	642566768
Product	aminoacyl-histidine dipeptidase
Protein accession	YP_699513
Protein GI	110802619
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01893] aminoacyl-histidine dipeptidase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0150704
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGTAT TAGAAAACCT AGAGCCTAAA AGTGTATTTA GATTTTTTGA AGATTTAACA 
AGAATACCAC ATGATTCTGG AAATGAAAAA GAACTTAGTG ATTATCTTGT TAAGTTTGCA 
AAGGATAGAA ATCTTGAAGT TATTCAGGAT GAGGCACTAA ATGTAATAAT TAAAAAGCCT 
GCGACTAAGG GGTATGAAAA TGTACCAGGA GTTATAATTC AAGGGCATAT GGATATGGTA 
TGTGAAAAAT TAAAGAGTAG TAATCACGAT TTTAAAAAAG ATCCTTTAAA ATTAAGAATT 
ATTGATGATA AATTTGTTTA TGCTACAGAT ACTACTTTAG GAGCAGATGA TGGTATTTCA 
TTAGCTTATG GATTAGCTAT TTTAGATTCT AACAATATAG AACATCCAGC AATAGAGTTT 
GTAGCAACTA CAGAGGAAGA AACAGTTATG GGGGGAGCTA CTGCTTTAGA TACTTCACTT 
TTAAAAGGAA AGGTTTTATT AAACATAGAT GCTGAAGAAG AAGGAGTATT TATTGTAGGG 
TGTGCTGGAG GAATTATGGT TTATCCAGAA ATAAATGCTG AATTTGAAGA TTTTAATGGA 
GAAGCTTTAA AATTAGAGAT TTCAGGTTTT AAGGGTGGAC ACTCAGGAAT GGAAATCCAT 
AAACAAAGAG GAAATGCCAA TAAGTTAATG GGAAGAATCT TATATGCTTT AAGCAAAGAA 
GTTGACTTTA ATATTGCATC AATTAAGGGT GGATCAAAAC ATAATGCAAT ACCACAATAT 
TGTCAAAGCA TAATTGCAGT TAAGAAAGAA GATAGAGAAA AGGTTAAAGA AATTTGTACT 
GCCTTAGAAA AAGATTTAAA GGCAGAATAC AGAATTGGAG AGCCAGATGT GAATCTTTCT 
GTTAAAAGCA TTGGAGGAGT AGAAAAACAA TTAACTAAAA AGGTTACAGA TGATATAACT 
AGATTTTTAG TTTTAGTTCC AGATGGATTA CAATCTATGA GTCAAGAGAT AAATGGATTA 
GTTGAAAGTA GCTTAAATCT TGGAATAGTA GAAATGGTAG AGGATAAAAT TAAATTTATT 
ATTGATATAA GAAGTGCAGT TAAGAGTAAA AAGATAGAAA TCACAAATAG AGTAGAGGCT 
CTTTGTAAAG TTATAGGAGC TAATATGACT AAAGATGGAG ATTATCCAGA GTGGGAATAT 
GAAGCAGAAT CAAAAATAAA AGATTTAAGT ATTAAAACTT ACAGTGACTT ATTTGGAATT 
GAGCCTAAAA TAACAGCTTT ACATGCAGGG CTTGAGTGTG GAATCTTTAA AGAAAAGATG 
GGAAAAGAAG TGGAAATTAT AAGCTTTGGT CCAGATATAT TTGATGTGCA TACAGCAAAT 
GAGCATTTTA AAATAGAATC TGTTGAAAGA TGTTATAGAT TCTTAATTGA ATTATTAAAG 
AACATGAAAT AA

Protein sequence

MRVLENLEPK SVFRFFEDLT RIPHDSGNEK ELSDYLVKFA KDRNLEVIQD EALNVIIKKP 
ATKGYENVPG VIIQGHMDMV CEKLKSSNHD FKKDPLKLRI IDDKFVYATD TTLGADDGIS 
LAYGLAILDS NNIEHPAIEF VATTEEETVM GGATALDTSL LKGKVLLNID AEEEGVFIVG 
CAGGIMVYPE INAEFEDFNG EALKLEISGF KGGHSGMEIH KQRGNANKLM GRILYALSKE 
VDFNIASIKG GSKHNAIPQY CQSIIAVKKE DREKVKEICT ALEKDLKAEY RIGEPDVNLS 
VKSIGGVEKQ LTKKVTDDIT RFLVLVPDGL QSMSQEINGL VESSLNLGIV EMVEDKIKFI 
IDIRSAVKSK KIEITNRVEA LCKVIGANMT KDGDYPEWEY EAESKIKDLS IKTYSDLFGI 
EPKITALHAG LECGIFKEKM GKEVEIISFG PDIFDVHTAN EHFKIESVER CYRFLIELLK 
NMK