Gene CPF_0139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_0139
Symbol
ID	4202270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	165074
End bp	166159
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	30%
IMG OID	638081020
Product	DNA-cytosine methyltransferase
Protein accession	YP_694603
Protein GI	110799020
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00921515
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAA TAGCAATTTC ATTTTTTGCA GGCGCTGGTG GATTGGATAT AGGAATACAT 
GAAGCTGGGT TTGATGTAAA ATTGAGTGTA GAATTAGAAG AAAAATACTG TGTGACATTA 
AAACAAAATA ATCCTACATT TAATGTAGTA AATGGAGATA TTATGGATTA TTCAAAAGAA 
AAAATATATA GTGATGCAGG ATTAAATTAT AATGATGAGA TTGATTTAAT ATTTGGTGGT 
AGCCCATGTC AGAGTTTTAG TACAGCTGGT AAACGACAAG CTTTTTCGGA TGAAAGAGGA 
AAGGCTATGT TAAAATTCAT TGAATTAATT GAAGAGGTAA AACCAAAAGC ATTTTTATTA 
GAAAATGTAA AGGGGTTATT ATCAGCAACA TTAAAACATC GTCCTTTAAA TCAAAGGGGA 
AAAGATTTTC CGCCATTAGA TGAAGATGAG GAAAATGGAA GTGCATTAAG GTATTTATTA 
AATCAAGTCA AAGATTATAA CGTTGTATAT AAAGTGCTTA ATTCAGCTGA ATATGGAGTT 
GCTCAAAAAA GAGAGAGAGT AATTTTTGTT GGAATAAGAA AAGATTTAAA CAAAGTATAT 
GAATTTCCAA ATCCTACTCA TGGAGTAGGA AGAAAATATC CATTTGTTAC AGTTAATGAT 
GTAATACAAG AGTTAGGAGA TATAAAACAT AATTATGTTA AGTATTCAGA GGAAAGATTA 
AAATATATGA AGTTAATACC TAAAGGTGGA GGTAATTGGA GAGATTTAAA TGAGGATATA 
GTTGAAAAGG CTATGGGGGG AGCATATAAA TCAGGTGGAG GTAAAACAGG ATATTTTAGA 
AGAATAAAAG CTAATGAACC AAGTCCTACA TTACTGACAT CTCCAATACA AAAAAGTACA 
AATATAGGGC ATCCGTATGA AGATAGACCT TTAAGTATAG AGGAATATAT CGCTATCCAA 
GGATTTCCTA AAGGGTATAA AATAAATGGA ACAATTAATA ATAAATATAC TCAGATAGGA 
AATGCAGTTC CAGTAAAATT AGCAAAAGTA TTAGGTGAAA AATTAATAGA TATCTTATAT 
GAGTAG

Protein sequence

MSKIAISFFA GAGGLDIGIH EAGFDVKLSV ELEEKYCVTL KQNNPTFNVV NGDIMDYSKE 
KIYSDAGLNY NDEIDLIFGG SPCQSFSTAG KRQAFSDERG KAMLKFIELI EEVKPKAFLL 
ENVKGLLSAT LKHRPLNQRG KDFPPLDEDE ENGSALRYLL NQVKDYNVVY KVLNSAEYGV 
AQKRERVIFV GIRKDLNKVY EFPNPTHGVG RKYPFVTVND VIQELGDIKH NYVKYSEERL 
KYMKLIPKGG GNWRDLNEDI VEKAMGGAYK SGGGKTGYFR RIKANEPSPT LLTSPIQKST 
NIGHPYEDRP LSIEEYIAIQ GFPKGYKING TINNKYTQIG NAVPVKLAKV LGEKLIDILY 
E