Gene CPF_0026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0026
Symbol
ID	4202400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	33434
End bp	34708
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	26%
IMG OID	638080901
Product	polyA polymerase family protein
Protein accession	YP_694495
Protein GI	110800095
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0617] tRNA nucleotidyltransferase/poly(A) polymerase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAATGA AATTACCTAA CAATGTCCAA TATATCTTAG AGAAATTTAA CTCTAATGGT 
TTTGAAGCCT TTATAGTTGG TGGTTGTGTA AGAGATTCTT TATTAAATAA AAAACCTCAA 
GATTATGATA TTACAACCAA TGCATTCCCT GAAAAAATAG AAGAGCTTTT TGATAAAACT 
ATTCCTACTG GTATTAAACA TGGAACAGTA ACAGTTTTAA TCGATAAAAA TCCTTATGAA 
GTAACTACTT ATAGGGTAGA TGGGGAATAT TTAAATAATA GAAAACCTAA AGACGTAAAG 
TTCGTTTCTA ATATAGAAGA AGATTTATCA AGAAGAGATT TTACTATAAA TGCAATGGCA 
TATAGCCCAT ATTTAGGATT TAAGGATTGT TTTAATGGAA AAGATGATCT AAAAAACAAA 
TTAATAAGAT GCGTTGGAGA TCCTGATAAA CGCTTCTCTG AAGACGCCTT AAGAATGCTT 
AGAGCAATTA GATTTAGTTG TCAATTAAAC TTTAAAATAG AAAAATTAAC TGCTGAATCT 
ATAAGAAAGA ATTTTAAATT AATAAAAAAT ATAAGCATGG AAAGAATTCA AAGTGAATTT 
ACTAAAATAA TTCTAAGCAA TGATCCAGAT AGAGGTCTTA TGCTTCTTAG AAAGCTAGGA 
TTTTCTGACT TTTTAGTTGA GGAATTTAAG AATTTAAAAC TAATAAATTG TTATGATTTA 
TATGATGATA TCCATGATAC TTATGGATTA ATAAATTCAC TTCCTAAAAA GCTTCATGTA 
AGATTAGCAG GATTATTCTA TAAAGTTTTT AATTCTGAAA ATGCAGTTGA GAAGTGCAGA 
ACTATATTAA AGAAACTTAA ATATGATAAT AATACAATCA ATGATACTTG CAACTTAGTA 
GAAAATATAA ATAATATTTC ATGTAATATG ACAAGAAAAA AACTAAAACT ACTTATAAAT 
TCAGTTGGAA CTGAAAATAT CTTTGATTTA TTAGATTTAC AAAAATCATA TCTATCTTAC 
ATGGATGAAT ATGATACTGA ATGTATAGAT ATATTAAAAA ACAGAGTTTC TGATATATTA 
GCTTCAAAAG AACCCATATT TATTAAGGAC TTAGCCATAA CAGGAAATGA CTTAATTACC 
GAACTTAATT TTAAACCTGG AAAAAATATA GGTGTTATAT TAAATTTTCT TCTTGAAAAT 
GTAATGCAAA CACCAGAGTT AAATAATAAG GAAGACTTAC TAAACCTTAG TAAGCAATTT 
TATTCATATA ATTAA

Protein sequence

MLMKLPNNVQ YILEKFNSNG FEAFIVGGCV RDSLLNKKPQ DYDITTNAFP EKIEELFDKT 
IPTGIKHGTV TVLIDKNPYE VTTYRVDGEY LNNRKPKDVK FVSNIEEDLS RRDFTINAMA 
YSPYLGFKDC FNGKDDLKNK LIRCVGDPDK RFSEDALRML RAIRFSCQLN FKIEKLTAES 
IRKNFKLIKN ISMERIQSEF TKIILSNDPD RGLMLLRKLG FSDFLVEEFK NLKLINCYDL 
YDDIHDTYGL INSLPKKLHV RLAGLFYKVF NSENAVEKCR TILKKLKYDN NTINDTCNLV 
ENINNISCNM TRKKLKLLIN SVGTENIFDL LDLQKSYLSY MDEYDTECID ILKNRVSDIL 
ASKEPIFIKD LAITGNDLIT ELNFKPGKNI GVILNFLLEN VMQTPELNNK EDLLNLSKQF 
YSYN