Gene CPF_2666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2666
Symbol	ptsI
ID	4202338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2938462
End bp	2940081
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	34%
IMG OID	638083532
Product	phosphoenolpyruvate-protein phosphotransferase
Protein accession	YP_697046
Protein GI	110799494
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1080] Phosphoenolpyruvate-protein kinase (PTS system EI component in bacteria)
TIGRFAM ID	[TIGR01417] phosphoenolpyruvate-protein phosphotransferase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAG GTATTGCTGC TTCAAAAGGA TATGCAATAG GAACTGTATT TATACAAGAA 
CATGAGGAAA TAATAATATC TGATGCGAAG GTTTCAGATA TAGCAGCTGA AAAAGAAAAA 
TTATCTAAAG CTTTAGCTCA ATCAAAAGAG CAATTAGAAG CAATAAAAGA AAAAACAGCT 
AATGAAATTG GAGAACATGA AGCTCAAGTT TTTGAAGCTC ATTTAATGTT ATTAGATGAT 
GTAGAGTTTA CTGGTCAAAT GGAAATGACT ATAGAAAATG ACCAATTAAA CGCTATGAAA 
GCTGTTCAAA ATGTTACAGA TACTTTCGTT ATGATATTTG ATTCTATGGA TGACCCTTAC 
ATGAGAGAAA GGGCAGCAGA TATAAAAGAC GTTTCTAAGA GAATAATAGC TAACCTAGCT 
GGCAAGGGTG GAAACGGAAT GGAAAATGTA GGAGCTAACA CTGTTGTTGT AGCTCATGAC 
TTAACACCTT CAGATACTGC TCAATTAGAT AGAAGTAAAG TTATTGGTTT CTTAACTAAT 
ATCGGGGGAA GAACTTCTCA CTCAGCTATA ATGGCTAGAA CTTTAGAAAT ACCAGCTGTT 
GTTGGATTAG GTAATATAAC AACTTCAGTT AAAAATGGGG ACACTGTAAT AGTTGATGGT 
ATTGAGGGTG TAGCTATAAT CAACCCAGAT GAAGCTACTA TAAACGAATA TAAAGCTAGA 
TTAGAAAAAT TTAAAGCAGA ACAAGAAGAA TTAAAGAAGT TAATAGATGT TAAAACAACT 
ACTAAATCAG GTAGAAGAAT AGAGGTTTGC GGAAACATAG GTAAACCAGA AGATATAGAT 
CAAGTTTTAG CAAATGGTGG AGACGGAGTT GGACTATTTA GAACTGAGTT CTTATACATG 
GACAGAGATG AAGCTCCAAC TGAAGATGAA CAATTTGAAG CATACAAATA TGTTTTAGAA 
AAAGCAGATG GTAAGCAAGT TGTTATCAGA ACATTAGATA TCGGTGGAGA TAAAACTCTT 
CCATACTTAC CATTACCAGA AGAGATGAAT CCATTCTTAG GATACAGAGC TATAAGATTA 
TGCTTAGACA GAAAAGATAT CTTTAGAGTT CAAATAAGAG CTTTATTAAG AGCTTCTGTT 
TATGGAAATC TTGCAGTAAT GTTCCCAATG ATTTCAGGAT TAGAAGAATT CCAACAAGCT 
AAAGCATTTG TTGAAGAATG CAAAGCTGAG TTAAAAGCAG AAGGTATAGC ATACTCAGAT 
TCAATTCAAT GGGGTATCAT GGTTGAAATC CCAGCTGCAG CAGTTTATGC TGATGAATTA 
GCTAAGCATG TTGATTTCTT CTCAATAGGA ACTAACGATT TAATACAATA TACATTAGCT 
GCTGACAGAA TGAGTGAAAA GGTATCATAC CTTTACAATC CAATGCATCC AGCTGTATTA 
AGATTAATCA AAATGACAAT AGATGGAGCT CACAAACATG GTAAGTGGGT AGGAATGTGT 
GGAGAGATGG CAGGAGATGA AAGAGCTATA CCAACATTAG TTGAATATGG TTTAGATGAA 
TTCTCAATGA GTGCTACATC AATCCTAACT GCTAAGAAAA TAATAATGGA ACAAGAATAG

Protein sequence

MKKGIAASKG YAIGTVFIQE HEEIIISDAK VSDIAAEKEK LSKALAQSKE QLEAIKEKTA 
NEIGEHEAQV FEAHLMLLDD VEFTGQMEMT IENDQLNAMK AVQNVTDTFV MIFDSMDDPY 
MRERAADIKD VSKRIIANLA GKGGNGMENV GANTVVVAHD LTPSDTAQLD RSKVIGFLTN 
IGGRTSHSAI MARTLEIPAV VGLGNITTSV KNGDTVIVDG IEGVAIINPD EATINEYKAR 
LEKFKAEQEE LKKLIDVKTT TKSGRRIEVC GNIGKPEDID QVLANGGDGV GLFRTEFLYM 
DRDEAPTEDE QFEAYKYVLE KADGKQVVIR TLDIGGDKTL PYLPLPEEMN PFLGYRAIRL 
CLDRKDIFRV QIRALLRASV YGNLAVMFPM ISGLEEFQQA KAFVEECKAE LKAEGIAYSD 
SIQWGIMVEI PAAAVYADEL AKHVDFFSIG TNDLIQYTLA ADRMSEKVSY LYNPMHPAVL 
RLIKMTIDGA HKHGKWVGMC GEMAGDERAI PTLVEYGLDE FSMSATSILT AKKIIMEQE