Gene CPF_0076 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0076
Symbol
ID	4202124
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	90897
End bp	91844
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	36%
IMG OID	638080957
Product	putative glucokinase
Protein accession	YP_694540
Protein GI	110800941
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID	[TIGR00744] ROK family protein (putative glucokinase)

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAATT ACGTTGTTGG AATAGATCTA GGGGGAACAA AAATTAGCTG TGCTCTTGCT 
GATCTAGAAG GAAATGTTAA AGCTCAACAT ACAACTCCAA CTAATGCTCA TGAAGGAGAG 
CAAGCAGTTT TAGATAGAAT TATAGGCTGT GTTGAAACTG TAATATGTGA AGGAAAAGTA 
ACTATTGATG AAGTAGAAGC AATAGGTATT GGATCACCAG GACCACTAGA TGCTAGAACT 
GGTATAATAA TAACAACTCC AAATTTACCT TTCAAAAACT TCAACTTAGT TTCACCATTA 
AAAGCTAAGT TTGGTATTCC TGTTTACTTA GATAATGATG CTAACGTAGC TGCTATAGGT 
GAATTTATGT TAGGTGCTGG AAAAGGTACT GAAAATATGA TTTATATAAC TGTAAGTACT 
GGTGTAGGTG GAGGAGCAAT CCTTAACGGT AAAATTTACA GAGGAAGTAC TTCAAACGCA 
TTAGAAATTG GACATTCAAC TGTTGCACCT GGAACTGTAA GATGTAATTG TGGTAACATG 
GGATGTCTAG AAGCTGTATC ATCAGGAACA GCTATTGGTA AAAGAGGAAG AGAGGCAGTT 
GCTACAAATG TAGAAACAAG CTTAAAAGAT TACGACAATG TAACTTCATA TGAAGTATTT 
GTTGAAGCAG CTAAAGGTGA TAGAGTTGCA AAATCAATAA TAGATGAAGC TTTAAACTAC 
TTAGGAATTG GTGTTGCAAA TGCAATAGCA ACTTTTGACC CAGACATGGT TGTTATAGGT 
GGAGGAGTTT CAAAAGCTGG AGAAGTTGTT TTTGAAACAG TTCAAGAAGT TGTTAATGAA 
AGATGTTTTA AAGCTATGGC TGAGCATTGT AAAATAGTTC CTGCTGGATT AGGAACTGAT 
GCAGGAGTTA TTGGAGCAGT AGCTTTAGCA TTATTAGAGT GCAAATAA

Protein sequence

MKNYVVGIDL GGTKISCALA DLEGNVKAQH TTPTNAHEGE QAVLDRIIGC VETVICEGKV 
TIDEVEAIGI GSPGPLDART GIIITTPNLP FKNFNLVSPL KAKFGIPVYL DNDANVAAIG 
EFMLGAGKGT ENMIYITVST GVGGGAILNG KIYRGSTSNA LEIGHSTVAP GTVRCNCGNM 
GCLEAVSSGT AIGKRGREAV ATNVETSLKD YDNVTSYEVF VEAAKGDRVA KSIIDEALNY 
LGIGVANAIA TFDPDMVVIG GGVSKAGEVV FETVQEVVNE RCFKAMAEHC KIVPAGLGTD 
AGVIGAVALA LLECK