Gene CPF_2656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2656
Symbol	buk
ID	4202880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2927971
End bp	2929041
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	32%
IMG OID	638083522
Product	butyrate kinase
Protein accession	YP_697036
Protein GI	110800296
COG category	[C] Energy production and conversion
COG ID	[COG3426] Butyrate kinase
TIGRFAM ID	[TIGR02707] butyrate kinase

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCATATA AATTATTAAT AATAAATCCA GGGTCTACAT CAACTAAAAT TGGTGTTTAT 
GAAGGTGAAA AAGAAATCTT AGAAGAAACT TTAAGACATT CAGCAGAAGA AATACTAAAA 
TATGATACAA TATTTGATCA ACTTGATTTT AGAAAAGAAG TTATTTTAAA GGTATTAAAA 
GAAAAAGGCA TTGACATAAA TGAGTTAGAT GCTGTTGTTG GAAGAGGTGG AATGCTTAAG 
CCAATAGAAG GTGGAACTTA TGAAGTCAAT GAAGCTATGG TTGAGGACTT AAAAATTGGG 
GTTCAAGGAC CACATGCTTC AAATTTAGGT GGAATATTAT CTAATGAAAT AGCAAAAGAA 
ATTGGTAAGA GAGCATTTAT AGTAGATCCA GTTGTTGTTG ATGAAATGGA AGATGTAGCA 
AGATTATCAG GAGTTCCAGA ATTACCAAGA AAAAGTAAAT TCCATGCATT AAATCAAAAG 
GCTGTTGCTA AGAGATATGC AAAAGAACAT AATACTTCAT ATGAAGATGT TAATTTAATA 
GTCGTTCATA TGGGGGGCGG AGTTTCAGTA GGAGCACATA GAAAAGGTAG AGTTATAGAT 
GTAAATAATG CATTAGATGG TGATGGACCA TTTTCACCAG AAAGAGCAGG TGGAGTTCCT 
TCAGGTGAAT TATTAGAAAT GTGTTTCTCA GGAAAGTATA GCAAAGAAGA AGTTTATAAA 
AAGTTAGTTG GAAAAGGCGG ATTTGTTGCG TATGCTAACA CAAATGATGC GAGAGATTTA 
ATAAAGCTAT CACAAGAAGG TGATGAAAAA GGCTCATTAA TATTTAATGC TTTCATATAT 
CAAATAGCAA AAGAAATAGG ATCAATGGCT GTAGTTTTAG ATGGAGAAGT TGATGCTATA 
GTATTAACTG GTGGAATTGC ATATAGTGAT TATGTAACTA ATGCTATAAA TAAAAAAGTA 
AAATGGATTG CACCTATGGT TGTATACGGT GGAGAAGATG AACTTTTAGC TTTAGCACAA 
GGAGCTATAA GAGTTTTAGA TGGCGTTGAA GAAGCAAAGA TATATAAATA G

Protein sequence

MAYKLLIINP GSTSTKIGVY EGEKEILEET LRHSAEEILK YDTIFDQLDF RKEVILKVLK 
EKGIDINELD AVVGRGGMLK PIEGGTYEVN EAMVEDLKIG VQGPHASNLG GILSNEIAKE 
IGKRAFIVDP VVVDEMEDVA RLSGVPELPR KSKFHALNQK AVAKRYAKEH NTSYEDVNLI 
VVHMGGGVSV GAHRKGRVID VNNALDGDGP FSPERAGGVP SGELLEMCFS GKYSKEEVYK 
KLVGKGGFVA YANTNDARDL IKLSQEGDEK GSLIFNAFIY QIAKEIGSMA VVLDGEVDAI 
VLTGGIAYSD YVTNAINKKV KWIAPMVVYG GEDELLALAQ GAIRVLDGVE EAKIYK