Gene CPR_2115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2115
Symbol	pepD
ID	4205972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2342192
End bp	2343643
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	29%
IMG OID	642566665
Product	aminoacyl-histidine dipeptidase
Protein accession	YP_699424
Protein GI	110803954
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2195] Di- and tripeptidases
TIGRFAM ID	[TIGR01893] aminoacyl-histidine dipeptidase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATAT TAAAAGGTTT AGAACCACAA AGTGTTTTAA AATATTTTGA AGAAATATCA 
CAAATTCCAA GAGGATCAGG TAATGAAAAG GGAATAAGTG ATTTTCTAGT TAACTTTGGA 
AAAAATTTAG GACTTGAAAC AATACAAGAT GAATCATTAA ATGTAATAAT AAGAAAACCT 
GCAACTCCAG GATATGAAAA TGCACCAGGA GTAATAATAC AAGGTCATAT GGATATGGTA 
TGTGAAAAAA ATAAAGATAC TATACATGAT TTTGAAAAAG ATCCTATTAA ACTTAGAGTA 
GATGGAGATT ATATATACGC TACAGGAACT ACATTAGGAG CAGATAATGG TATAGCAGTA 
GCTTATGGAA TGGCTGTTTT AGCTTCAAAT GATATAGCAC ACCCTGCTAT AGAACTTTTA 
GTTACAACTG ATGAAGAAGT TGGAATGGGT GGAGCTATTG CTTTAGATGG AACTTTATTA 
AAAGGTAAAT ATCTTTTAAA CATAGATTCA GAGGAAGAAG GAAAACTTTT AGTAAGCTGT 
GCAGGTGGAG CTAGAAGTGA AGTTACTTTA CCAATAAACT TTGAAGAAAT GGAAAAAGAT 
TTTGAAGTTT ATGAAATCAT GCTAAGAGGA CTAAAGGGTG GTCACTCTGG AATGGAAATA 
GATAAACAAA GAGGAAACTC TAATAAGTTA ATGGGAAGAG TATTAAATGA TATTAATGCT 
AACTGTGATA TTAGATTAAT ATCAATTAAT GGTGGATCTA AGGTAAATGC TATTCCAAGA 
GAATGTGATA CTTTACTAGC TGTTAAAAAA GAAGATGTTA AAAAATTAGA AGAATTAATT 
CAAAAATGGG ATTCAATATT AAAGGATGAA TATCATGCTA ATGATAGTGG AGTTAATGTA 
ACTTTAGTTA AAAAAGAAGA AAATCATAAA GTATTTTCTA AAGACACTAC ATTTAAAGCT 
ATAAAAATAA TGAACTTAAT TCCTGATGGA GTTGATACTT ATAGTATAGA AATGAAAGGA 
TTAGTTCAAA GTTCAACAAA CCTAGGTGTT GTTACTACAG AAGGAGATAA AATTGTCTTT 
GCTAGTTCAA CAAGAAGTTC AGTTGAAACT TTAAAAACTA AACTTTTAGA TGAAATAGCT 
GATGTTGCAG AAATATTAGG TGGAGAATTT GAAATACAAG CACCATACCC AGCTTGGCAA 
TATAATCCAG ATTCAAAAAT AAGAGAACTT TGCAGCAATG TATATAAAAA TATGACAGGA 
AAAGATCCTG AAATAATAGC TATACATGCT GGATTAGAAT GTGGATTATT AGGAGAAAAA 
ATAGAAGGAT TAGATATGAT TTCATTTGGT CCTAATATGT ATGATGTTCA TACTCCAAAT 
GAACATGTTA GCATATCTTC AGTAAAAAAT GTTTGGGATT TCTTAGTTGA AATATTAAAA 
GCTATAAAAT AA

Protein sequence

MNILKGLEPQ SVLKYFEEIS QIPRGSGNEK GISDFLVNFG KNLGLETIQD ESLNVIIRKP 
ATPGYENAPG VIIQGHMDMV CEKNKDTIHD FEKDPIKLRV DGDYIYATGT TLGADNGIAV 
AYGMAVLASN DIAHPAIELL VTTDEEVGMG GAIALDGTLL KGKYLLNIDS EEEGKLLVSC 
AGGARSEVTL PINFEEMEKD FEVYEIMLRG LKGGHSGMEI DKQRGNSNKL MGRVLNDINA 
NCDIRLISIN GGSKVNAIPR ECDTLLAVKK EDVKKLEELI QKWDSILKDE YHANDSGVNV 
TLVKKEENHK VFSKDTTFKA IKIMNLIPDG VDTYSIEMKG LVQSSTNLGV VTTEGDKIVF 
ASSTRSSVET LKTKLLDEIA DVAEILGGEF EIQAPYPAWQ YNPDSKIREL CSNVYKNMTG 
KDPEIIAIHA GLECGLLGEK IEGLDMISFG PNMYDVHTPN EHVSISSVKN VWDFLVEILK 
AIK