Gene CPF_2872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2872
Symbol
ID	4203625
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	3140496
End bp	3141671
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	32%
IMG OID	638083739
Product	putative methyltransferase
Protein accession	YP_697236
Protein GI	110800285
COG category	[R] General function prediction only
COG ID	[COG1092] Predicted SAM-dependent methyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGAGTA AGTTTTATTT ACACAAAGGT AAAAACAAAA AAGCTGAACA AGGCAGACCT 
TGGATATATA TTGATGAAAT AAACGAATAT GATGGAGATT ATGAAAACGG AGATATAGTT 
GAAGTTTACA ATCATAAAGG TTATTTCTTA GGAAAAGGCT ATATAAATGA CAGAAGTAAA 
ATAACTATAA GAATAATGAC TAAAGATATA GATGAAGAAA TAGATGAGGA TTTCTTCAAG 
AGAAGATTTA AAACTGCATG GGAATATAGA AAGAAAGTTA TAGATACATC TTCATGTAGA 
TTCATCTTTG GAGAGGCTGA TTTCCTTCCT GGTTTAACAG TTGATAAATT TGAAGATTAT 
TATGTAATTC AAATATCAAC TCTTGGAATG GATAAATATA GAGACCTAAT AGTTAAAATT 
CTAGTTGAGG AATACGGTGC TAAAGGTGTC TATGAAAGAA GTGATATAAA AACTAGAGAA 
ATAGAAGGTT TAGAGCAAAG AAAAGGCTTC TTAACTGAAC CATTTGATAC AGATATACAA 
ATAGTTGAAA ATGGAGTTAA ATACATAGTT GACTTAGAAA ATGGTCAAAA AACTGGTTTC 
TTCTTAGATC AAAAAGAAAA CAGAGCTGCA ATGCATAGAA TATGTAAAGG TATGGATGTT 
TTAGATTGCT TCACTCATAC TGGCTCTTTT GCTTTAAATG CCGGTATAGC AGGTGCTAAA 
TCAGTTTTAG GAATAGATGT ATCTCAACAC GCTGTAGACT GTGCTACTAG AAACGCTGAA 
CTTAATAACC TTCAAGATAG GGTTAAATTT GAAAAGCATA ATGCCTTTGA TGTATTAGGA 
GATTGGTCAA GAGAAGGAAA ACAATTTGGT GTTGTTATTT TAGATCCACC AGCTTTCACA 
AAATCAAGAA ATACTGTTAA GCAAGCAATA AGAGGATATA AAGAAATAAA TCTTAGAGGA 
ATAAAAATGG TTAAAGAAGG TGGTTACTTC GCTACATGCT CTTGTTCACA TTATATGGAT 
GAAGAACAAT TAAAGAAAAC TGTAGCTGAG GCTGCTCATG ATGCAAGAAG AACTTTAAGA 
CAAATAGAAG TTAGAACTCA AAGTGCAGAC CACCCTATAC TTTGGAACTC TGACGAATCA 
TATTATTTAA AATTCTTCAT ATTCCAAGTA TTCTAA

Protein sequence

MASKFYLHKG KNKKAEQGRP WIYIDEINEY DGDYENGDIV EVYNHKGYFL GKGYINDRSK 
ITIRIMTKDI DEEIDEDFFK RRFKTAWEYR KKVIDTSSCR FIFGEADFLP GLTVDKFEDY 
YVIQISTLGM DKYRDLIVKI LVEEYGAKGV YERSDIKTRE IEGLEQRKGF LTEPFDTDIQ 
IVENGVKYIV DLENGQKTGF FLDQKENRAA MHRICKGMDV LDCFTHTGSF ALNAGIAGAK 
SVLGIDVSQH AVDCATRNAE LNNLQDRVKF EKHNAFDVLG DWSREGKQFG VVILDPPAFT 
KSRNTVKQAI RGYKEINLRG IKMVKEGGYF ATCSCSHYMD EEQLKKTVAE AAHDARRTLR 
QIEVRTQSAD HPILWNSDES YYLKFFIFQV F