Gene MCA0836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA0836
Symbol
ID	3103154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	880101
End bp	881351
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	56%
IMG OID	637170039
Product	type I restriction-modification system S subunit
Protein accession	YP_113333
Protein GI	53805024
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.444813
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGGTG AATGGAAGGA ATGCTCGCTC GGCGATGTGA TCGAGTTGAA GCGTGGATAC 
GACCTGCCAC AAAAAGACCG CTTGCCTGGT GACGTTCCGC TGGTCTCATC TTCTGGGGTC 
ACGGACACCC ACGCAAAGGC AATGGTTAAG GGACCGGGGG TCGTGACTGG GCGATATGGA 
ACATTGGGAC AAGTGTTTTA TGTTGAGCAG GATTTTTGGC CGCTGAACAC CACGCTTTAT 
GTGCGCGACT TCAAGGGTAA CGATCCGCGC TTCATTAGCT ATTTTCTGCG CGATGTCGAC 
TTCCATGCCT ATTCAGACAA GGCTGCCGTT CCCGGCCTGA ATCGCAACCA CCTACATCAA 
GCAAAGGTTC GGATTCCCAG TGACCCCAAC GAACAACGCG CCATCGCCCA CATCCTTGGC 
ACGCTGGACG ACAAGATCGA ACTCAACCGC CGCCAGAACG AGACGCTGGA GGCGATGGCC 
CGCGCCTTGT TCAAGGCATG GTTCGTGGAC TTCGAGCCGG TGCGCGCCAA ATGTAGGGGC 
GACCGGCCGG TCGCCCCTAC GGGGTGGCAA TGGCCGCAAC ACATCCTCGA CCTCTTCCCC 
GACCGCCTCG TCGAATCGGA ACTTGGGGAG ATTCCGGAGG GGTGGCGTGT GTTTTCGTTC 
GGCGATGTGG CGGAGCAAGG AAAGGGTTTC GTAAATCCAA GCAGGGAACC TGGAGAGAGG 
TTTACGCACT ACAGTCTTCC TGCTTTTGAT GCGGGGAAGA TGCCTGTCAT TGAACCAGGC 
GAATCAATCA AAAGTAACAA GACTCCAGTT CCAGATGGCG CAGTATTGGT ATCAAAGCTG 
AACCCGCACA TTCCGCGCAT CTGGCTTGTC GGTGAGGCTG GCAATAGGGC GGTCTGTTCG 
ACTGAGTTTA TTGTTTGGAC TCCGAAATCC CCAGCACAAA GTGCCTTTGT GTATTGCCTT 
GCCTCATCGC CGGAATTCGT CGGTGCCATG TGCCAGCTGG TAACAGGAAC ATCGAACAGC 
CACCAACGCG TCAAGCCCGA TCAGTTACGG GAAATACGTG TCTTCGCAGG TAACGAGAAT 
GTCGTCGAGA CCTTCTCCAA GACGGCAGAG CCGTTGATGG ATCAGTTTTT ACAAAATACT 
CGGCAATCCC GCATCCTCGC CCAACTGCGC GACACCCTGC TACCCAAACT TATTTCTGGC 
GAGCTGCGCG TGAAGGATGC CGAGGCGTTC CTGAAGGAGC GGGGGCTGTG A

Protein sequence

MAGEWKECSL GDVIELKRGY DLPQKDRLPG DVPLVSSSGV TDTHAKAMVK GPGVVTGRYG 
TLGQVFYVEQ DFWPLNTTLY VRDFKGNDPR FISYFLRDVD FHAYSDKAAV PGLNRNHLHQ 
AKVRIPSDPN EQRAIAHILG TLDDKIELNR RQNETLEAMA RALFKAWFVD FEPVRAKCRG 
DRPVAPTGWQ WPQHILDLFP DRLVESELGE IPEGWRVFSF GDVAEQGKGF VNPSREPGER 
FTHYSLPAFD AGKMPVIEPG ESIKSNKTPV PDGAVLVSKL NPHIPRIWLV GEAGNRAVCS 
TEFIVWTPKS PAQSAFVYCL ASSPEFVGAM CQLVTGTSNS HQRVKPDQLR EIRVFAGNEN 
VVETFSKTAE PLMDQFLQNT RQSRILAQLR DTLLPKLISG ELRVKDAEAF LKERGL