Gene CPR_1056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1056
Symbol
ID	4204297
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	+
Start bp	1204643
End bp	1205710
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	33%
IMG OID	642565612
Product	regulatory protein pfoR
Protein accession	YP_698378
Protein GI	110802515
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1299] Phosphotransferase system, fructose-specific IIC component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.630661
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAATTT TATTTGGAAC ACTATTATTA TTATTAGTAT TAGGAGGCTT TACATTATTT 
AGTTATAAGG CGCCACATGG AATGAAGGCT ATGGGTGGAT TAGCAAATGC TGCCTGTGCA 
AGTTTTTTAG TTGAAGCCTT TCACTTAGCA TTTTTTGGAG AAGTATTTCA AATACCTTTT 
TTAGCACAAG TAGGTTCATC TAATGGAAGT CTTGGCGGAG TTGCAGCTGC AATTTTAGTA 
CCTTTAGCAC TTGGAGTTTC TCCTGTATAT GCAGTATTAA CAGGTCTTGC ATGTTCAGGA 
TTTGGAATAT TACCAGGATT TATAGCTGGT TATCTTGGTT CATTTGTTAT AAAGTTTTTA 
GAGAAAAAAA TACCAGCTGG TCTTGATTTA ATAGTTATTA TTGTCCTTGG AGCTCCACTT 
GTAAGAGGAA TAGCTGCAAT TTCAAATCCG CTTGTAGAAA CAACTCTACA AAATATTGGA 
GGAGTTATAA CAGCTACATC AACAGCTAGT CCTATAATGA TGGGAATTAT ACTTGGAGGA 
ATAGTAACAG TTGTTGCAAC TGCCCCTTTA AGCTCAATGG CTTTAACAGC TATGTTAGGA 
TTAACTGGAC TTCCAATGGC AATTGGAGCA TTAGCAGTAT TTGGTTCATC ATTTATGAAT 
TTTGTATTCT TTGGAAAAAT GAAATTTGGA AGCAAAAAAG ATACTATTGC AGTTGCTATA 
GAACCTCTTA CACAAGCAGA TATAATTTCT GCAAATCCAA TACCAGTATA CGTAACTAAT 
TTTATAGGGG GAGCTTTATC AGGAATAGTT GTTTCATTGA TGGGTCTTAC AAATAATACA 
CCAGGAACTG CTACACCAAT AGCTGGTTTT GCTGTAATGT TTGCATATAA TCCAGCTATT 
AAAGTTTTAA TTACTGCGGC AATAATAATA GTTCTTAATG TTATTGCTGG TATGATAGGG 
TACTTAATAT TTAGAAATTA TAAAATAATG AAAGCAGATG AAATTAGAAA TAATAAAGAT 
TCTGAAAACA ATTTAAATGT TGAAAATGAA GAAGTTTTAG TAGTTTAA

Protein sequence

MQILFGTLLL LLVLGGFTLF SYKAPHGMKA MGGLANAACA SFLVEAFHLA FFGEVFQIPF 
LAQVGSSNGS LGGVAAAILV PLALGVSPVY AVLTGLACSG FGILPGFIAG YLGSFVIKFL 
EKKIPAGLDL IVIIVLGAPL VRGIAAISNP LVETTLQNIG GVITATSTAS PIMMGIILGG 
IVTVVATAPL SSMALTAMLG LTGLPMAIGA LAVFGSSFMN FVFFGKMKFG SKKDTIAVAI 
EPLTQADIIS ANPIPVYVTN FIGGALSGIV VSLMGLTNNT PGTATPIAGF AVMFAYNPAI 
KVLITAAIII VLNVIAGMIG YLIFRNYKIM KADEIRNNKD SENNLNVENE EVLVV