Gene CPF_1018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_1018
Symbol	dcm
ID	4202576
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	1170044
End bp	1171384
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	30%
IMG OID	638081899
Product	DNA-cytosine methyltransferase
Protein accession	YP_695464
Protein GI	110799652
COG category	[L] Replication, recombination and repair
COG ID	[COG0270] Site-specific DNA methylase
TIGRFAM ID	[TIGR00675] DNA-methyltransferase (dcm)

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000487753
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTACACAT ATATAGATTT ATTTGCTGGA CCAGGAGGAT TATGTACTGG ATTTAAAAAT 
GCTGGATTTA AGCCTTTAAT TGCAGTTGAG ATGAGTGATA ATACTGTAAA AACTTATGCA 
AGAAACCATG AAGCGGAAGT TTATTCTTTA CAAGAACTTT TAGAAAACAA GGGGAGACTA 
GAAGAAATAT TAAATATTAA TACTGATAAT ACTTGCTTAA TACATGGAGA TATACGTTTA 
GTAGATAATG ATATTATAGT TGAAATACTT CAAAAGAAAT TTAAAACTAA TAGTGTAGAT 
GTTGTTGCGG GAGGACCTCC TTGTGAATCT TTCTCACTTG CTGGGAAGAG AATTGATGGT 
GATGAAAGAG ATGATCTATT TAAGAATATG CTAAGAATAG CTAGTATTTC AAATAGTAAA 
TTTATATTTT TTGAAAATGT ACCAGGATTA TTAACTAAGA AAAGTAATAA TATAAAAGTA 
TTTGATGTTA TTGTAGAAGA ATTTGATAAT TATGGATATA ATCTTGCTAG TACTGATAAG 
AATATAATTA AATGTTTAGC TGCTGATTAT GGTGTTCCTC AAAATAGAGA GAGAGTTTTC 
CTTATAGGAA TAAATAAAAT GTATGGAGAG AATCCATATA TTTATCCAGA AAAAACTCAC 
GGAGAAGGAA GAAAATTTGA ATATATTAGT GTGAGTGATG CTCTAAGATA TTTACCTGAG 
TTGAATAGTG GAGAAGGTGC TGATATTCAA CAAATAACAT ATAACTTTGA GGAAGATTTT 
AGAAAAGGAA AGATTTCAGA AGCGGTATAT AATTATTTAA AATTTATTGC AGGAAAGGAA 
GGGTATATAC CACCACATAT AAAGGAATCT ATTGATGATG GCTTAATAGA GATACATAAA 
GCTGTTAAGC ATAGAGAAAA AATGATTAAT AGAATGAGTT ATATTAAACA GGGCGAAGGT 
ATGAAAAAGG CTGCTGAAAG ATTAATAAAT GAGGGAAAAG AAGATATTGT TAGAGCTTAT 
TTTCCCAATA AATTATATGC TGCTAGAAAT AGAAGATTAA AAGCAAATGA ACCATCATTT 
ACAGTAACAA GTCATTGTCT TGATGAAATG GTTCATCCTT ATAATAATAG AGGTTTGACT 
CCAAGAGAGG CAGCAAGGTT GCAATCATTT CCAGATTGGT ATGTGTTTGA AGGTGAGTAT 
GTAAAATTTC ATTCGGATCC ACAACAAGAT AAGTATGAGC AATGTGGTGA TGCGATTCCA 
GTATTATTAG TAAAAGCTTT AGCAGAACAA TTAAAAATTG CATTAAATAT TGTTAGTGAA 
CGAACTAGTA TTAATAAGTA G

Protein sequence

MYTYIDLFAG PGGLCTGFKN AGFKPLIAVE MSDNTVKTYA RNHEAEVYSL QELLENKGRL 
EEILNINTDN TCLIHGDIRL VDNDIIVEIL QKKFKTNSVD VVAGGPPCES FSLAGKRIDG 
DERDDLFKNM LRIASISNSK FIFFENVPGL LTKKSNNIKV FDVIVEEFDN YGYNLASTDK 
NIIKCLAADY GVPQNRERVF LIGINKMYGE NPYIYPEKTH GEGRKFEYIS VSDALRYLPE 
LNSGEGADIQ QITYNFEEDF RKGKISEAVY NYLKFIAGKE GYIPPHIKES IDDGLIEIHK 
AVKHREKMIN RMSYIKQGEG MKKAAERLIN EGKEDIVRAY FPNKLYAARN RRLKANEPSF 
TVTSHCLDEM VHPYNNRGLT PREAARLQSF PDWYVFEGEY VKFHSDPQQD KYEQCGDAIP 
VLLVKALAEQ LKIALNIVSE RTSINK