Gene CPR_2066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2066
Symbol
ID	4205340
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2287287
End bp	2289044
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	28%
IMG OID	642566616
Product	helicase domain-containing protein
Protein accession	YP_699375
Protein GI	110802850
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA ATGCGGCTCA AAGGGAGTAT AAAAAATTAT CAGGTCAAAT AAATCAAATA 
GAAAACATAG TAAGACATTC AAAAGCAGGA GCACTTTTTG AACATGAATC AACCTTAAGA 
AAAAAAATAT TGCAATTAAA AGAGATGAAA GATCAAGGGT TAAAAGGATA TGAATCTCTT 
TATGATAGAT ATGAAGAATT ATTAGAAGAG GTAGGAAAGA GAATTCTAGA AAATTATAAT 
AAGAAAAATG ACACTAATTT TGATTTTTAT GAAGTATTAA GAAACAATTA CAATGTATTT 
CTTAATTCAG GAATTATGAC TCTTCTTGTA AAACATCATA TTCCAGAGCT AATATCTAAG 
GAATTTGATG AGAAGTTTCC AGCAAATCCA AAGGATGAAT ATCTTCATAC AAGAAGACTT 
AAAAGAAAAT TCTATCTTCA CTTAGGAGAA ACCAATACTG GAAAAACCTA TACTGCTATG 
CAAAGACTTA AAGAGGTTAG AAAAGGTGTA TATTTATCTC CTCTTAGAAT TTTAGCCTTA 
GAAAACTTTG AAAGATTAAA TAATGAGGGT ATTAAATGTA ATCTTCTTAC TGGAGAAGAA 
GAAATATTAT TTGAAGATGC AACACATGTA TCATGTACCA TAGAAAAAGC TAATATACAT 
GAAAAATATG ATGTGGCAGT TATAGATGAA ATTCAAATGA TAGATGATTC ACAAAGAGGG 
TATGCTTGGA CTAGAGCTTT ACTTGGTTTA TATTGTACTG AAATACATAT ATGTGGAGCC 
TTTAATGCTA AGAATATATT AAAAGAAATT ATAGAAGATT GTGGAGATGA CTATGAGATT 
ATAGAATATC ATAGAGATAT TCCACTTATT GTAGAAGATG AAAGTTTTCA TCCAAAAAAT 
GTTAAAGAGG GAGATGCCTT AGTTTTATTT TCAAAGAAAA AAGTTCTTCA AATGGCTGAG 
CAATATTCAC AGATGGGAAT TAAATGCTCC ATAATCTATG GAGATTTACC ACCAGAGGTT 
AGAAAAAAAC AGTATGAAGA ATTTATAACG GGAAAAAATA AAATTTTAAT AACAACTGAT 
GCCATTGGAA TGGGAGTTAA TCTTCCTATA AAGAGAATTA TTTTCTTATC AATAAGCAAA 
TTTGATGGAG AGCAAATGAG AGAGTTAACT TCTCAGGAGG TTAAACAAAT TGCAGGAAGA 
GCAGGAAGAA AAGGCATATA TGATACGGGA TATGTAGCTA CTTATAGAGA TAATAAGGAA 
TTTATTGAAG AGAGATTAGA GGAAGAGGAT ATTAGTATAA AAAGAGCAGT TTTAGGACCT 
TCAGATGCAA TATTAGAAAT TGATAATCTT CCTTTAAATG AAAAATTAGC TTTATGGAGC 
ACAAAGAAAT GTGAAGTTCC ATACTATAGA AAAATGGATA TAAGTGAATA TTTAATAATA 
TTAGAAAGAT TAAAATCATA TAAACTTCTT GAAGAAATTC AATGGGAGCT TTTAAAAATT 
CCTTTTGATA TATCTAAAGA TGACTTAATG AATCAATTTT TAAATTTTGT TGATCAGCTA 
TTTATAAATG ATCAAGAAGA ACTATTTAAA CCTCAATGTT ATTCAGGAAC TTTATATGAC 
TTAGAAACTT ATTATCAAAT GGTAAATATG TATTATTCTT TTAGCAAGAG ATTTAATTTA 
AATTTTGATT TAGAGTGGAT TGAAAATGAA AGGCTTACTG TGAGTGAAGA AATAAACAAT 
ATTCTTATGA GAATTTAA

Protein sequence

MKKNAAQREY KKLSGQINQI ENIVRHSKAG ALFEHESTLR KKILQLKEMK DQGLKGYESL 
YDRYEELLEE VGKRILENYN KKNDTNFDFY EVLRNNYNVF LNSGIMTLLV KHHIPELISK 
EFDEKFPANP KDEYLHTRRL KRKFYLHLGE TNTGKTYTAM QRLKEVRKGV YLSPLRILAL 
ENFERLNNEG IKCNLLTGEE EILFEDATHV SCTIEKANIH EKYDVAVIDE IQMIDDSQRG 
YAWTRALLGL YCTEIHICGA FNAKNILKEI IEDCGDDYEI IEYHRDIPLI VEDESFHPKN 
VKEGDALVLF SKKKVLQMAE QYSQMGIKCS IIYGDLPPEV RKKQYEEFIT GKNKILITTD 
AIGMGVNLPI KRIIFLSISK FDGEQMRELT SQEVKQIAGR AGRKGIYDTG YVATYRDNKE 
FIEERLEEED ISIKRAVLGP SDAILEIDNL PLNEKLALWS TKKCEVPYYR KMDISEYLII 
LERLKSYKLL EEIQWELLKI PFDISKDDLM NQFLNFVDQL FINDQEELFK PQCYSGTLYD 
LETYYQMVNM YYSFSKRFNL NFDLEWIENE RLTVSEEINN ILMRI