Gene CPF_1768 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1768
Symbol
ID	4202444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	-
Start bp	1993044
End bp	1994261
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	28%
IMG OID	638082640
Product	DEAD-box ATP dependent DNA helicase
Protein accession	YP_696204
Protein GI	110800080
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00592847
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAAAT TTTTAAAGTT AGGATTAAGT GAAGAGGTTT TAAAATCTTT AGTAGGATTA 
GGAATAGAGG AGCCAACAGA TATTCAGGAA AAAGCTATAC CTGAAATTTT AAAAGGTAAA 
AATGTAATAG GAAAAGCTGA AACAGGAACA GGAAAAACTT TAGCATATTT ACTTCCTATA 
ATAGAAAAGA TTGATGATTC AAAAAATGAG ATGCAAGCTA TTATTCTTTC ACCAACTCAT 
GAATTAGGAG TTCAGATAAA CAATGTTTTA AATGATCTTA AAAGAGGACT TGGAAAAAAG 
ATAACTTCAA CAACTTTAGT TGGAAGCGGA AATATAAAGA GACAAATGGA GAAGCTTAAA 
AATAAGCCTC ATATACTTGT TGGAACTACA GGGAGAATTT TAGAGCTTAT AAATAAGAAA 
AAAATAACAA CTAATACTAT AAAAACAATA GTTATTGACG AAGGTGATAA ACTATTAGAT 
TTTATAAACA TAAAAGATGT GAAAAGTGTT GTTAAATCTT GTCCAAGGGA TACTCAAAAG 
CTTATATTCT CAGCTACAAT GAATGAAAAA GCCTTAGAAA CTGCAGATGA ATTAATAGGA 
ACTAGTGAGC TTATTCAAGC AAAAGCTGCA AACAAGGTTA ATGAAAATAT AGAACATGGA 
TATTTTCAAG TAGAATTAAG AGATAAAATA GACTTTTTAA GAAAGCTTAT ACATGCTATA 
GGGGATGAGA AAAAAATAAT AGTTTTTATA AATAATAGCT ATAATGTACA TAATGTAATT 
CAAAAGTTAA AATATAATAA AATAGAGGCA GTTTCTCTTC ATGGAAGTGA TAATAAAATG 
GAGAGAAAGA AGGCACTTCA AGATTTTAGA AGTGGAAAAG CCAAGGTTTT AATAACTTCA 
GATGTATCAG CTAGAGGGCT AGATATTAAG GGAGCTACAC ATATAGTTAA CTTAGATATT 
CCTATGAATT CTCAAAACTA CTTACATAGG GTAGGACGTG TAGGAAGAGC TGGAGAAAAA 
GGCTTTGCAT ACTCTTTAGC AGATTATAAA GAAGAAAAAA TAATAGTAAA ATGTGAAAGA 
CAATTAAAAA TAAAAATTCC TAGAGTTTAT TTATATGAAG GAAAGATACA TGAAACAGAG 
GTAAAAAAGG TTCCTTCAAA TAAAAACAAT AGTAAAAAGA AAAGCAATTT ACCTAAAAAG 
GTATATAAAA AAAGATAA

Protein sequence

MDKFLKLGLS EEVLKSLVGL GIEEPTDIQE KAIPEILKGK NVIGKAETGT GKTLAYLLPI 
IEKIDDSKNE MQAIILSPTH ELGVQINNVL NDLKRGLGKK ITSTTLVGSG NIKRQMEKLK 
NKPHILVGTT GRILELINKK KITTNTIKTI VIDEGDKLLD FINIKDVKSV VKSCPRDTQK 
LIFSATMNEK ALETADELIG TSELIQAKAA NKVNENIEHG YFQVELRDKI DFLRKLIHAI 
GDEKKIIVFI NNSYNVHNVI QKLKYNKIEA VSLHGSDNKM ERKKALQDFR SGKAKVLITS 
DVSARGLDIK GATHIVNLDI PMNSQNYLHR VGRVGRAGEK GFAYSLADYK EEKIIVKCER 
QLKIKIPRVY LYEGKIHETE VKKVPSNKNN SKKKSNLPKK VYKKR