Gene CPR_2012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2012
Symbol
ID	4204336
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2218767
End bp	2219852
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	29%
IMG OID	642566562
Product	stage II sporulation protein P
Protein accession	YP_699321
Protein GI	110801662
COG category
COG ID
TIGRFAM ID	[TIGR02867] stage II sporulation protein P

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGAGTTA TTAATAAAAG AGAGATACCC ATAGGAGTGA TTGTTCTTTT ATCTTTACTT 
ATAATATTTA TGTTTAGATT TATGAAGATT GCAGCAAGTA AAGACATGAG AGAAAATTTA 
TCATATATAC AACTTTTAAA TGCAGGAATG CCTGTTGCAA AGGGAACATA TTACGATGAG 
AATGCTTATT TAGAAAGTAA TATTACATTA AAAAGTTTAG CCTTAGAAAC TTTAAATATA 
AAGCCTCTAG ATCCGATAGA GTTAGTAATG AATGAAGTGC CTTACTTTGG TGCAGTAAAT 
AAAATAGCTT CAATTGATAA AGTTAATTAT GTTTCTGCTG AAAAAGTATC TTCATTTGAT 
TTAAACAAAG ATAGTATAGA TATAGTTTCT GAGGAAGAAT CTAAGAAAAG TGCAGAATTA 
GAAGCTAGTA AAAATAGTGA AGTTTATGAT CCAAGTTTAA AAAAGGAACT AGATCAGTCT 
AAGCCAGAGG TGCTTATTTA TCATACTCAT AATTCAGAGG GGTATACTGA GGAGAGAACT 
TCAAACAATG AAGAACATAA CGTAGTTGGA GTAGGAACTT TAGTTGCAAA AGAACTTGAA 
GAAAACTATG GTATATCAGT TATTCATGAT AAAACAAATC ACTCAGCTTC ATATGAGCAA 
TCTTACAATA AATCTAGAGA GACAGTTAAA AAATATATTA ATGAATATGA TGATTTTAAG 
ATGGTAATAG ATATTCATAG AGATTCTGTT GGAGAGCATA ACAAAAAGAA TTTAACTGCT 
AATATAAATG GAGAAAGTTT AGCTAAGATT ATGTTTGTTA CAACTAAGAA TAGCCAATAT 
TTTAATGATG CTGAATCCTT GGCCTATAGA TTTATTAATA AAGCCAATGA GCTTTTTCCT 
GATATTTTAA GAAGACAGGA AACCTTTAAG TATGATAGGG GAAAAAATGC GTTTAACCAA 
CAATATAATA AGAATTCAAT GCTTATTGAA GTTGGTGCAG AAGTAAATAC TTCTAAAGAG 
GCACAAGCTA CAGCAAAGTA TATAGCTAGA TTAATAGCAG AAGAATTAAA CAGAAAAAGT 
GAATAA

Protein sequence

MRVINKREIP IGVIVLLSLL IIFMFRFMKI AASKDMRENL SYIQLLNAGM PVAKGTYYDE 
NAYLESNITL KSLALETLNI KPLDPIELVM NEVPYFGAVN KIASIDKVNY VSAEKVSSFD 
LNKDSIDIVS EEESKKSAEL EASKNSEVYD PSLKKELDQS KPEVLIYHTH NSEGYTEERT 
SNNEEHNVVG VGTLVAKELE ENYGISVIHD KTNHSASYEQ SYNKSRETVK KYINEYDDFK 
MVIDIHRDSV GEHNKKNLTA NINGESLAKI MFVTTKNSQY FNDAESLAYR FINKANELFP 
DILRRQETFK YDRGKNAFNQ QYNKNSMLIE VGAEVNTSKE AQATAKYIAR LIAEELNRKS 
E