Gene CPF_2359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2359
Symbol
ID	4203788
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	2623715
End bp	2625472
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	28%
IMG OID	638083224
Product	helicase domain-containing protein
Protein accession	YP_696782
Protein GI	110799948
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA ATGCGGCTCA AAGGGAGTAT AAAAAATTAT CAGGTCAAAT AAATCAAATA 
GAAAACATAG TAAGACATTC AAAAGCAGGA GCACTTTTTG AACATGAATC AACCTTAAGA 
AAAAAAATAT TGCAATTAAA AGAGATGAAA GATCAAGGGT TAAAAGGATA TGAATCTCTT 
TATGATAGAT ATGAAGAATT ATTAGAAGAG GTAGGAAAGA GAATTCTAGA AAATTATAAT 
AAGAAAAATG ATACTAATTT TGATTTTTAT GAAGTTTTAA GAAACAATTA CAATGTATTT 
CTTAATTCAG GAATTATGAC TCTTCTTGTA AAACATCATA TTCCAGAGTT AATATCTAAG 
GAATTTGATG AGAAGTTTCC AGCAAATCCA AAGGATGAAT ATCTTCATAC AAGAAGGCTT 
AAAAGAAAAT TCTATCTTCA CTTAGGAGAA ACGAATACTG GAAAAACCTA TACTGCTATG 
CAGAGACTTA AAGAGGTTAG AAAAGGTGTA TATTTATCTC CTCTTAGAAT TTTAGCTTTA 
GAGAACTTTG AAAGATTGAA TAATGAGGGT GTTAAATGTA ATCTTCTTAC TGGAGAAGAA 
GAAATATTAT TTGAAGATGC AACACATGTA TCATGCACCA TAGAAAAAGC TAATATACAT 
GAAAGATATG ATGTGGCAGT TATAGATGAA ATTCAAATGA TAGATGATTC ACAAAGAGGG 
TATGCTTGGA CTAGAGCTTT ACTTGGTTTA TATTGTACTG AAATACATAT ATGTGGAGCC 
TTTAATGCTA AGAATATATT AAAAGAAATT ATAGAAGATT GTGGAGATGA CTATGAGATT 
ATAGAATATC ATAGGGATAT TCCACTTATT GTAGAAGATG AAAGTTTTCA TCCTAAAAAT 
GTTCAAGAGG GAGATGCCTT AGTTTTATTT TCAAAGAAAA AAGTTCTTCA AATGGCTGAG 
CAATATTCAC AGATGGGAAT TAAATGCTCC ATAATCTATG GAGATTTACC ACCAGAGGTT 
AGAAAGAAGC AGTATGAAGA ATTTATAACT GGAAAAAATA AAATTTTAAT AACAACTGAT 
GCCATTGGAA TGGGAGTCAA TCTTCCTATA AAGAGAATTA TTTTCTTATC AATAAGTAAA 
TTTGATGGAG AACAAATGAG AGAGTTAACT TCGCAGGAGG TTAAACAAAT TGCAGGAAGA 
GCAGGAAGAA AAGGCATATA TGATACTGGA TATGTAGCTA CTTATAGAGA TAATAAAGAA 
TTTATTGAAG AGAGATTAGA GGAAGAGGAT ATTAGTATAA AAAGAGCAGT TTTAGGACCT 
TCAGATGCAA TATTAGAAAT TGATAATCTT CCTTTAAATG AAAAATTAGC TTTATGGAGT 
ACAAAGAAAT GTGAAGTTCC ATACTATAGA AAAATGGATA TAAGTGAATA TTTAATAATA 
TTAGAAAGAT TAAAATCATA TAAACTTCTT GAAGAAATTC AATGGGAGCT TTTAAAAATT 
CCTTTTGATA TATCTAAAGA TGACTTAATG AATCAATTTT TAAATTTTGT TGATCAGCTA 
TTTATAAATG ATCAAGAAGA ACTATTTAAA CCTCAATGTT ATTCAGGAAC TTTATATGAC 
TTAGAAACTT ATTATCAAAT GGTAAATATG TATTATTCTT TTAGCAAGAG ATTTAATTTA 
AATTTTGACT TAGAGTGGAT TGAAAATGAA AGGCTTACTG TAAGTGAAGA AATAAACAAT 
ATTCTTATGA GAATTTAA

Protein sequence

MKKNAAQREY KKLSGQINQI ENIVRHSKAG ALFEHESTLR KKILQLKEMK DQGLKGYESL 
YDRYEELLEE VGKRILENYN KKNDTNFDFY EVLRNNYNVF LNSGIMTLLV KHHIPELISK 
EFDEKFPANP KDEYLHTRRL KRKFYLHLGE TNTGKTYTAM QRLKEVRKGV YLSPLRILAL 
ENFERLNNEG VKCNLLTGEE EILFEDATHV SCTIEKANIH ERYDVAVIDE IQMIDDSQRG 
YAWTRALLGL YCTEIHICGA FNAKNILKEI IEDCGDDYEI IEYHRDIPLI VEDESFHPKN 
VQEGDALVLF SKKKVLQMAE QYSQMGIKCS IIYGDLPPEV RKKQYEEFIT GKNKILITTD 
AIGMGVNLPI KRIIFLSISK FDGEQMRELT SQEVKQIAGR AGRKGIYDTG YVATYRDNKE 
FIEERLEEED ISIKRAVLGP SDAILEIDNL PLNEKLALWS TKKCEVPYYR KMDISEYLII 
LERLKSYKLL EEIQWELLKI PFDISKDDLM NQFLNFVDQL FINDQEELFK PQCYSGTLYD 
LETYYQMVNM YYSFSKRFNL NFDLEWIENE RLTVSEEINN ILMRI