Gene CPR_2352 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2352
Symbol	ptsI
ID	4206117
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2580866
End bp	2582485
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	34%
IMG OID	642566902
Product	phosphoenolpyruvate-protein phosphotransferase
Protein accession	YP_699617
Protein GI	110803789
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1080] Phosphoenolpyruvate-protein kinase (PTS system EI component in bacteria)
TIGRFAM ID	[TIGR01417] phosphoenolpyruvate-protein phosphotransferase

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAG GTATTGCTGC TTCAAAAGGA TATGCAATAG GAACTGTATT TATACAAGAA 
CATGAGGAAA TAATAATATC TGATGCGAAG GTTTCAGATA TAGCAGCTGA AAAAGAAAAA 
TTATCTAAAG CTTTAGCTCA ATCAAAAGAG CAATTAGAAG CAATAAAAGA AAAAACAGCT 
AATGAAATTG GAGAACATGA AGCTCAAGTT TTTGAAGCCC ATTTAATGTT ATTAGATGAT 
GTAGAGTTTA CTGGTCAAAT GGAAATGACT ATAGAAAATG ACCAATTAAA CGCTATGAAA 
GCTGTTCAAA ATGTTACAGA TACTTTCGTT ATGATATTTG ATTCTATGGA TGACCCTTAC 
ATGAGAGAAA GGGCAGCAGA TATAAAAGAC GTTTCTAAGA GAATAATAGC TAACCTAGCT 
GGCAAGGGTG GAAACGGAAT GGAAAATGTA GGAGCTAACA CTGTTGTTGT AGCTCATGAC 
TTAACACCTT CAGATACTGC TCAATTAGAT AGAAGTAAAG TTATTGGTTT CTTAACTAAT 
ATCGGGGGAA GAACTTCTCA CTCAGCTATA ATGGCTAGAA CTTTAGAAAT ACCAGCTGTT 
GTTGGATTAG GTGATATAAC AACTTCAGTT AAAAATGGGG ACACTGTAAT AGTCGATGGT 
ATTGAGGGTG TAGCTATAAT CAACCCAGAT GAAGCTACTA TAAATGAATA TAAAGCTAGA 
TTAGAAAAAT TTAAAGCAGA ACAAGAAGAA TTAAAGAAAT TAATAGATGT TAAAACAACT 
ACTAAATCAG GTAGAAGAAT AGAGGTTTGC GGAAACATAG GTAAACCAGA AGATATAGAT 
CAAGTTTTAG CAAATGGTGG AGACGGAGTT GGACTATTTA GAACTGAGTT CTTATACATG 
GACAGAGATG AAGCTCCAAC TGAAGATGAA CAATTTGAAG CATACAAATA TGTTTTAGAA 
AAAGCAGATG GTAAGCAAGT TGTTATCAGA ACATTAGATA TCGGTGGAGA TAAAACTCTT 
CCATACTTAC CATTACCAGA AGAGATGAAT CCATTCTTAG GATACAGAGC TATAAGATTA 
TGCTTAGACA GAAAAGATAT CTTTAGAGTT CAAATAAGAG CTTTATTAAG AGCTTCTGTT 
TATGGAAATC TTGCAGTAAT GTTCCCAATG ATTTCAGGAT TAGAAGAATT CCAACAAGCT 
AAAGCATTTG TTGAAGAATG CAAAGGTGAG TTAAAAGCAG AAGGTATAGC ATACTCAGAT 
TCAATTCAAT GGGGTATCAT GGTTGAAATC CCAGCTGCAG CAGTTTATGC TGATGAATTA 
GCTAAGCATG TTGATTTCTT CTCAATAGGA ACTAACGATT TAATCCAATA TACATTAGCT 
GCTGACAGAA TGAGTGAAAA GGTATCATAC CTTTACAATC CAATGCATCC AGCTGTATTA 
AGATTAATCA AAATGACAAT AGATGGAGCT CACAAACATG GTAAGTGGGT AGGAATGTGT 
GGAGAGATGG CAGGAGACGA AAGAGCTATA CCAACATTAG TTGAATATGG TTTAGATGAA 
TTCTCAATGA GTGCTACATC AATCCTAACT GCTAAGAAAA TAATAATGGA ACAAGAATAG

Protein sequence

MKKGIAASKG YAIGTVFIQE HEEIIISDAK VSDIAAEKEK LSKALAQSKE QLEAIKEKTA 
NEIGEHEAQV FEAHLMLLDD VEFTGQMEMT IENDQLNAMK AVQNVTDTFV MIFDSMDDPY 
MRERAADIKD VSKRIIANLA GKGGNGMENV GANTVVVAHD LTPSDTAQLD RSKVIGFLTN 
IGGRTSHSAI MARTLEIPAV VGLGDITTSV KNGDTVIVDG IEGVAIINPD EATINEYKAR 
LEKFKAEQEE LKKLIDVKTT TKSGRRIEVC GNIGKPEDID QVLANGGDGV GLFRTEFLYM 
DRDEAPTEDE QFEAYKYVLE KADGKQVVIR TLDIGGDKTL PYLPLPEEMN PFLGYRAIRL 
CLDRKDIFRV QIRALLRASV YGNLAVMFPM ISGLEEFQQA KAFVEECKGE LKAEGIAYSD 
SIQWGIMVEI PAAAVYADEL AKHVDFFSIG TNDLIQYTLA ADRMSEKVSY LYNPMHPAVL 
RLIKMTIDGA HKHGKWVGMC GEMAGDERAI PTLVEYGLDE FSMSATSILT AKKIIMEQE