Gene CPR_C0014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_C0014
Symbol
ID	4206661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008265
Strand	-
Start bp	14684
End bp	15913
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	27%
IMG OID
Product	phage portal protein, HK97 family
Protein accession	YP_699943
Protein GI	110804051
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	77
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTTTTCA GAAAAGGCTT TAAAAACCAA AGTCAAGAAA TATCTATAGA TGATAAAAAA 
ATACTTGAAT GGTTAGGAAT AAATCCAAGT GAAACATATG TTAATGGTAA GAGTTGTTTA 
AAACAAGCAA CAGTTTTTGG GTGTATAAGA ATTTTAAGTG ATAATATAAG CAAATTACCT 
ATAAAAATTT ATCAAAAAAA GGATGGAATA AAAAGAGTTC CAGATCATTA TTTAGAATAT 
TTATTGAAAT TAAGACCCAA TCCTTATATG AGTTCTAGTG ATTTTTGGAA GTGTATTGAA 
GTTCAAAGAA ATATTTATGG AAATGCATAT GTTGCTTTAG ATTTTAAGAA AAATGGTGAA 
ATAAAGGGAT TATATCCTTT GAAATCCGAT GGAATGAAAA TATTTGTTGA TGATACTGGC 
CTTTTAAATT CAGAAAACAA TGTTTGGTAT TTATATACTG ATGATTTAGG CCAAAGGCAT 
AAGTTTATGA GTGATGAAAT TTTACATTTT AAAGGATTAA CAGCTGATGG TTTAGCTGGA 
CTAAGTGTTA TTGAATTATT AAATCATTTA ATAGAGAATG GAAAAAGTTC AGAAACTTAT 
TTAAATAATT TCTTTAAAAA TGGATTACAA GTTAAAGGCT TAGTTCAATA TGCTGGAGAT 
TTGAATCCAG AAGCAGAAGA AGTTTTTAAA GAAAATTTTG AAAGAATGTC TAGTGGTTTA 
AAAAATGCAC ATAGAATAGC TATGTTACCT ATAGGATATA AATTTGAACC TATAAGTCAA 
AAATTAGTTG ATGCACAATT TTTAGAAAAC TCTCAATTAA CAATAAGACA AATTGCTTCA 
GTTTTTGGAG TTAAAATGCA CCAATTAAAT GATTTAGATA GAGCAACACA TTCTAACATT 
ACAGAGCAAA ACAGAGAATT TTATATTGAT ACATTACAAT CAATATTAAA TATGTACGAG 
CTTGAAATTA ATTATAAATT ATTTTTAATC AGCGAAATAA AAAATGGATT TTACTCAAAG 
TTTAATGTAG ATACAATTTT GAGAGCTGAT ATAAAAACAA GATATGAAAG TTATAAAGAA 
GCTATTCAAA ATGGATTTAA AACTCCTAAT GAAATCAGAG AATTAGAAGA GGATGAACCT 
TTAGAAGGTG GAGATGTTCT TTTAATTAAT GGTAATATGA TTCCAGTAAA AATGGCTGGG 
GAACAGTATT CGAAAGGGGG TGAAAAATAG

Protein sequence

MLFRKGFKNQ SQEISIDDKK ILEWLGINPS ETYVNGKSCL KQATVFGCIR ILSDNISKLP 
IKIYQKKDGI KRVPDHYLEY LLKLRPNPYM SSSDFWKCIE VQRNIYGNAY VALDFKKNGE 
IKGLYPLKSD GMKIFVDDTG LLNSENNVWY LYTDDLGQRH KFMSDEILHF KGLTADGLAG 
LSVIELLNHL IENGKSSETY LNNFFKNGLQ VKGLVQYAGD LNPEAEEVFK ENFERMSSGL 
KNAHRIAMLP IGYKFEPISQ KLVDAQFLEN SQLTIRQIAS VFGVKMHQLN DLDRATHSNI 
TEQNREFYID TLQSILNMYE LEINYKLFLI SEIKNGFYSK FNVDTILRAD IKTRYESYKE 
AIQNGFKTPN EIRELEEDEP LEGGDVLLIN GNMIPVKMAG EQYSKGGEK