Gene CPF_1985 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1985
Symbol
ID	4203653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2224553
End bp	2226199
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	33%
IMG OID	638082854
Product	DAK2 domain-containing protein
Protein accession	YP_696418
Protein GI	110799755
COG category	[R] General function prediction only
COG ID	[COG1461] Predicted kinase related to dihydroxyacetone kinase
TIGRFAM ID	[TIGR03599] DAK2 domain fusion protein YloV

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATTTA ATAAAGTAAA TGGGGAACAC TTGTATTATA TGATGAGTAA TGCAGCAAAT 
AAGCTAGAGT TACAGAGTGA ATATGTAAAC TCTCTTAACG TTTTCCCAGT TCCAGATGGA 
GATACAGGAA CAAACATGTC TATGACATTT AGAGCTGCTG TTAAGGAAAT CGAAGGAATG 
GATAACAAAA ACATTGGTGA AGTTTCTAAG AAACTAGCTA AGGGTGCTCT TATGGGTGCA 
AGAGGAAACT CAGGTGTTAT TCTTTCACAA ATTCTTAGAG GTATATCAAA AGGGCTTGAA 
GGAAAAGAAG AGGCTGATGC AAGTGAATTT GCTAATGCAC TTTTAGAGGG AAGTAAATCA 
GCGTATAAGG CTGTTATGAG ACCAACAGAG GGAACAATAC TTACAATTGT TAGAACTGCT 
GGTGAAGTGG CTGTAGCCTT AAAAGAAGAT AATATAACTG AACTTATGAG AGAAGTATGC 
AGAGAAAGTA AAATTATGCT TGATAAGACA CCAGAAATGT TACCAGCATT AAAGAAAGCT 
AAAGTTGTTG ATTCAGGCGG AATGGGATTA TTAATAATCC TTCAAGGAAT GCAAGAAGCT 
TTAGAAAATG GATTAAAAGT AACTACAGGA ACACCACAAG CTGTTAAATC TTCAGTAGCT 
AAGGCTCAAA GAAGTGAAAC TATGAGTGAA GAAGATATTA AATTTGGATA CTGTACTGAG 
TTTATAATCT TAGGGGACTC AAACCATGCA GAAGAATTTA AATCAAAAGT TATAAATAAG 
GGTGATTCTT TAGTTGTTGT TGGATATGAG GATGTAATTA AAGTTCATAT TCACACAAAT 
AATCCAGGAA AAGTTCTAGA AGAGGCAGTT AAATTTGGAG AACTTTCAAA AATTAAGATT 
GATAACATGA GAGAAGAGCA TAGAGAAATG CTTGAAGGTA TGTATGAAGA GGCAGCTGAA 
ACAGAGGAGA GTGTTGCAGC TGGAGAGTTT AAAAAATATG CATTTATATC AGTAGCTATG 
GGTGAAGGTA TGAAAAACAT ATTTAAGGAC TTAGGTGTTG ATTATGTTAT AGAAGGTGGT 
CAAACTATGA ACCCAAGTAC TCAAGATATG TTAGAAGCTA TTGAAAAATT AAATGCTGAG 
CATATATTTA TTTTACCTAA CAATAAAAAT ATAATTATGG CAGCTAATCA AGCAGCTGAA 
ATATCAGATA AGGATATAAG AGTTATACCA ACTAAGACAA TTCCTCAAGG AATAACTTGT 
ATAACTATGT TTAACCCAGA AGCTGACGTT GAAGAAAATA CTGAAGAATT AAAAGAAGCT 
ATGGAAATGG TAAAAACAAC TTCTGTAACA TATGCTGTTA GAGATACTGA AGTTGATGGA 
AAAGAAATCA AAGAAGGTAA TATCTTAGGC TTAGTTGAAG GTAAGATAAA AGAAGTTGGA 
GAAGATCCAT ATAAAGTAGC TGAAGATTTA ATAGATTCTT TAGTTGATGA AGATTCAGAG 
TTAATCACTA TATTCTATGG TAAAGACTGT GAAGAGGAAA AAGTTGATGC CTTAATTGAA 
AAACTAGAAG GAAAATATGA AGATTTAGAT GTTCAATGTT ATAAGGGTGA ACAGCCATTA 
TATTACTTCA TAATGTCAGT AGAATAA

Protein sequence

MKFNKVNGEH LYYMMSNAAN KLELQSEYVN SLNVFPVPDG DTGTNMSMTF RAAVKEIEGM 
DNKNIGEVSK KLAKGALMGA RGNSGVILSQ ILRGISKGLE GKEEADASEF ANALLEGSKS 
AYKAVMRPTE GTILTIVRTA GEVAVALKED NITELMREVC RESKIMLDKT PEMLPALKKA 
KVVDSGGMGL LIILQGMQEA LENGLKVTTG TPQAVKSSVA KAQRSETMSE EDIKFGYCTE 
FIILGDSNHA EEFKSKVINK GDSLVVVGYE DVIKVHIHTN NPGKVLEEAV KFGELSKIKI 
DNMREEHREM LEGMYEEAAE TEESVAAGEF KKYAFISVAM GEGMKNIFKD LGVDYVIEGG 
QTMNPSTQDM LEAIEKLNAE HIFILPNNKN IIMAANQAAE ISDKDIRVIP TKTIPQGITC 
ITMFNPEADV EENTEELKEA MEMVKTTSVT YAVRDTEVDG KEIKEGNILG LVEGKIKEVG 
EDPYKVAEDL IDSLVDEDSE LITIFYGKDC EEEKVDALIE KLEGKYEDLD VQCYKGEQPL 
YYFIMSVE