Gene MCA1888 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1888
Symbol	hsdM
ID	3103261
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	2029427
End bp	2031007
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	64%
IMG OID	637171045
Product	type I restriction-modification system, M subunit
Protein accession	YP_114323
Protein GI	53803793
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID	[TIGR00497] type I restriction system adenine methylase (hsdM)

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCGAAA AGCTGTCTCA ACAGGAAGTC AACGCCACCG CCTGGGCGGC GTGCGACACC 
TTCCGGGGCG TGGTCGATCC CGCGCAGTAC AAGGACTACA TCCTGGTGAT GCTGTTCCTG 
AAGTACATCA GCGACCTTTG GAACGACCAC TACGCCGAAT ACAAGGCGCA GTACGGGGAT 
GACGACGAGC GCATCCGCCG CAAGCTCGAG CGCGAGCGCT TCATCCTGCC CTATGTCGAG 
CTGAAGGAAG ACGATCAAGA GACCGGCAAG AGCCAGGTCA TCGACCGCTT CCTGGGCGAC 
TTCAATGCGC TGTACGAGCG CCGCAACGAG CCCAACATCG GCGAGCTGGT CAACATCGTG 
CTCGACCACA TCGAGGACGC CAACAAGGCC AAGCTCGAAG GGGTGTTTCG CAACATCGAC 
TTCAACAGCG AGGCCAACCT CGGCAAGGCC AAAGACCGCA ACCGCCGCCT CAAAACCCTG 
CTGGAGGACT TCGCCAAGCT CGACCTGCGC CCTTCGCGCG TGTCCGAAGA CGTCATCGGC 
AATACCTACA TCTACCTCAT CGAACGCTTC GGCTCGGATG CCGGCAAGAA GGCCGGCGAG 
TTCTACACCC CCAAGATGGT CTCGCGGCTG TTGGCGGCGC TGGCCAACCC CAGGCCGGGC 
GACCGCATCT GCGACCCTTC CTGCGGCTCG GGCAGCCTGC TGATCGAAGC CGCGCAGTGG 
GTCGAGGCGC AGGGCAGCCA CAACTACGCC CTGTTCGGCG AAGAAGTGAA CGGCGCCACC 
TGGGCGCTGG CGCGGATGAA CATGTTCATC CACAGCAAGG ACGCAGCGCG CATCGAGTGG 
TGCGACACCC TGAACAGCCC AGCGCTGATC GAGGGCGACC GGCTAATGAA GTTCAATGTG 
GTGGTCGCCA ACCCGCCGTT TTCGCTCGAC AAGTGGGGCG CAGAGCACGC CGACCACGAC 
CGTTTCAACC GCTTCTGGCG CGGCGTGCCG CCCAAGTCCA AGGGCGACTG GGCCTTCATC 
ACCAACATGA TCGAGCGCGC CCTGCCAAGG GAAGGCCGGG TGGCCGTGGT CGTGCCGCAC 
GGCGTGCTCT TTCGCGGCGG CGCCGAAGGC CGCATCCGCC GCGCCATGAT CGAGGAAAAC 
CTGCTCGATG CCGTCGTGGG CTTGCCGGGC AACCTGTTCC CCACCACCTC GATCCCGGTG 
GCCATCCTGC TCTTTGACCG CGCCCGCGAA AAAGGCGGCC CGCGTGAGGA TGTGCGCGAC 
GTGCTGTTCG TGGACGCGAG CCGCGAGTTC ATTCCCGGCA AGAACCAGAA CCAGCTCTCC 
GAAGCGCACT TTCAGAAGAT CGTCTCGACG GTGGCCGCGC GGCGCAACGT CGACAAATAC 
GCCTACGTGG CCTCACTCGA CGAGATAGCC GAAAACGACT TCAACCTCAA CATCCCGCGT 
TACGTCGACA CCTTCGAGGA GGAGGAAGAA ATCGACGTCG CCGCCGTGCA GCGCGAAATC 
GAACAGCTCG AACGGGAGCT TGCCGACGTC CGCGCCCGCA TGCGCGAGCA CCTCAAGGCG 
CTGGGGGTGG AGGGCGTATG A

Protein sequence

MTEKLSQQEV NATAWAACDT FRGVVDPAQY KDYILVMLFL KYISDLWNDH YAEYKAQYGD 
DDERIRRKLE RERFILPYVE LKEDDQETGK SQVIDRFLGD FNALYERRNE PNIGELVNIV 
LDHIEDANKA KLEGVFRNID FNSEANLGKA KDRNRRLKTL LEDFAKLDLR PSRVSEDVIG 
NTYIYLIERF GSDAGKKAGE FYTPKMVSRL LAALANPRPG DRICDPSCGS GSLLIEAAQW 
VEAQGSHNYA LFGEEVNGAT WALARMNMFI HSKDAARIEW CDTLNSPALI EGDRLMKFNV 
VVANPPFSLD KWGAEHADHD RFNRFWRGVP PKSKGDWAFI TNMIERALPR EGRVAVVVPH 
GVLFRGGAEG RIRRAMIEEN LLDAVVGLPG NLFPTTSIPV AILLFDRARE KGGPREDVRD 
VLFVDASREF IPGKNQNQLS EAHFQKIVST VAARRNVDKY AYVASLDEIA ENDFNLNIPR 
YVDTFEEEEE IDVAAVQREI EQLERELADV RARMREHLKA LGVEGV