Gene CPR_2177 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_2177
Symbol
ID	4205002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	2402792
End bp	2404555
Gene Length	1764 bp
Protein Length	587 aa
Translation table	11
GC content	29%
IMG OID	642566727
Product	HemK family modification methylase
Protein accession	YP_699477
Protein GI	110803251
COG category	[J] Translation, ribosomal structure and biogenesis [R] General function prediction only
COG ID	[COG2890] Methylase of polypeptide chain release factors [COG3872] Predicted metal-dependent enzyme
TIGRFAM ID	[TIGR00536] HemK family putative methylases [TIGR03534] protein-(glutamine-N5) methyltransferase, release factor-specific

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000299232
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAAT GCCAAGTAGG CGGTCAAGCA GTATTAGAAG GCGTTATGAT GAGGGGATCA 
AAAGGAACAG CTACAGCAGT TAGAACTCCA GAGGGAGATA TAGAGGTTTC TTTTGAAAAA 
ACTATACCAT ATACAAAGAA AAATAAAATT TTAGGACTAC CTTTTATAAG AGGATTTGTA 
ACTCTTATAG AGTCTTTAAT TGTAGGATTA AAATCATTAA ATTATTCAGC AAGTTTTTTT 
GATGATACAG AACCATCTAA ATTTGAAGAT TGGTTAAATA ATAAATTTGG TGAAAAAGCT 
AATAATGTAA TAATGACACT TACAATTATG CTTTCCTTTG TATTTGCCAT AATTTTATTT 
GTAGCAATAC CAACTGGAAT TACTTTTTTA CTTAAAAAAC TTAATATTCC AGATTGGAGT 
TTAAGTGCTA TTGAAGGAAT CATAAGTATT GGTATGCTTT TAGGATACAT GTACTTAATG 
GGAAAAGTAG ATGATATAGA AAGAGTATTT CAATATCATG GAGCAGAACA TAAGACTATA 
TTCTGTTATG AGAATGAAGA TGAACTTACA GTTGAAAATG TAAGAAAATA TTCTAGATTT 
CATCCTAGAT GTGGAACAAA CTTTCTATTT TTAGTTGCTA TTGTAAGTAT ATTTATATTT 
TCCTTTACTA AATGGGATTC AGTTGCTCAG AGAACGGCTA TAAGAGTAGC GATGTTACCG 
GTAATATCAG GAATAACTTA TGAACTTATA AAATGGCTTG GCAAATCTCA AGGAAATTTT 
GCAAAGATAA TAGCAGCGCC GGGATTACAA TTGCAAAAAT TGACTACAAG GGAGCCTGAT 
GATTTACAAA TTGAAGTAGC AATAGCTTCT TTAAGGAGGG CTGAAGGGTT GAAAGAACCA 
AATAAAAAAG TTGGAGAATT ATTAAATTTA GGAAATGAAA CTTTAAAAGA AGTAGGTATA 
GATACATATA TATTAGATAC TCAATTATTA TTAGGAAAAA TTTTAGAAAA AGATAAAATA 
TGGCTTATAA CGAATAAAAA TGAAGAAGTT AAAAAGTCAG ATGAAATACA TTTCTTAAAT 
TTATTAGAAA AAAGAAAATC AAAAATGCCT ATGCAATATA TTTTAGGAAC TTGCGAATTT 
ATGGGATTAG ATTTTTATGT AGAAGAGGGA GTTTTAATTC CAAGAGGAGA TACTGAAATA 
ATTGTAGAGG AAGTATTAAA CAATATAGAT GAAGATGCAG AAATTAATGT ATGTGATTTA 
TGTTGTGGAA GTGGAGCTAT AGGCTTATCT TTAGCTAATT ATAGAAAAAA TATTATTGTA 
GATTTAGTAG ATATAGATGA TATACCAGAA AAAGTTACAA GAAAAAATAT AAGAGAATTA 
GAATTATCAA AAAGATGTGG CTTTATTAAG AGTGATCTTT TAAGTGAAGT CATTAAAAAA 
GGAAATAAGT ATGATATTCT AGTTTCTAAT CCACCATATA TAAGAACGGA AGTCATAAAT 
ACTTTAATGA AAGATGTTAA AGATTATGAG CCGCACTTAG CTTTAGATGG GGGAGAAGAT 
GGTTTAATAT TCTATAGAAG AATTATTGAT GAATCTTTAG AAGTATTAAA AGAAAATGGT 
ATATTAGCTT TTGAAATAGG ACATGATCAA GGTGAGGATG TTAAAAATCT TATGATTGAA 
AAAGGATATT ACGATGTTAA GGTCATAAAA GATTTAGCTG GTTTAGATAG ATGTGTTATA 
GGAAGAGTAA GCCTTGAAAG ATAG

Protein sequence

MRKCQVGGQA VLEGVMMRGS KGTATAVRTP EGDIEVSFEK TIPYTKKNKI LGLPFIRGFV 
TLIESLIVGL KSLNYSASFF DDTEPSKFED WLNNKFGEKA NNVIMTLTIM LSFVFAIILF 
VAIPTGITFL LKKLNIPDWS LSAIEGIISI GMLLGYMYLM GKVDDIERVF QYHGAEHKTI 
FCYENEDELT VENVRKYSRF HPRCGTNFLF LVAIVSIFIF SFTKWDSVAQ RTAIRVAMLP 
VISGITYELI KWLGKSQGNF AKIIAAPGLQ LQKLTTREPD DLQIEVAIAS LRRAEGLKEP 
NKKVGELLNL GNETLKEVGI DTYILDTQLL LGKILEKDKI WLITNKNEEV KKSDEIHFLN 
LLEKRKSKMP MQYILGTCEF MGLDFYVEEG VLIPRGDTEI IVEEVLNNID EDAEINVCDL 
CCGSGAIGLS LANYRKNIIV DLVDIDDIPE KVTRKNIREL ELSKRCGFIK SDLLSEVIKK 
GNKYDILVSN PPYIRTEVIN TLMKDVKDYE PHLALDGGED GLIFYRRIID ESLEVLKENG 
ILAFEIGHDQ GEDVKNLMIE KGYYDVKVIK DLAGLDRCVI GRVSLER