Gene Msil_1551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1551
Symbol
ID	7092057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	1673298
End bp	1674617
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	55%
IMG OID	643464877
Product	type I restriction enzyme
Protein accession	YP_002361863
Protein GI	217977716
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGTCTC TTCGTTTCAA AAACGTCATG CGGGAGCGTG TCGACCTTTC AGAGACCGGA 
GAAGAAACGC TTCTTTCTGT TTCTGAATAT TACGGCGTAA AGCCAAGAGC AGAAGCCTTT 
CAGGGCGAGG AATACGAATC CCGGGCAGAG TCCTTGGAAG GCTATCGTCA AGTTCAACGC 
GGCGATTTCG TCATGAACTA TATGCTTGCC TGGAAGGGTG CATACGGCAT TTCTGAGTAT 
GACGGTATCG TCAGCCCAGC ATACGCGGTT TTCCAAATAG ATAAATCTAA GATCGATCTA 
AAATATTTAC ACCATAGGAC TAGATCTAAC CCAATGCGAG CGCTTTTCCG CTCCCGATCC 
AAGGGCATAA TTGACTCTCG ATTGCGTCTA TACCCAGATG CACTTCTTGC TACGGAGATT 
GATCTTCCAG GCCTCGCCGC TCAGAAGGTG ATTGCTGATT TCCTCGACCG TGAGACCGCC 
CGCATCGATC AATTGATCGA GAAGAAGGAA CGGTTCTCAG CGCTCGCAGC TGAACGCTGG 
CGCGCCACAC TGGACGCTGA GATACTTGGA CGCACGACCG CCGGCAAACG GAGCCTAACA 
AGCGGCCAAC CGTATATTTC CGACGTCCCC GCCGACTGGG TTCTTACTCC GCTCAAGCAT 
CTTGTCGATC CGCGCAGGCC CGTCATGTAC GGCATCGTCT TGCCAGGCCC AAACGTCGAG 
AATGGCATTA TGATCGTCAA AGGTGGCGAC GTGAAGCCGA ACCGCTTGTC ACCAGACCGC 
CTCTGCAAAA CCAGTAGGGA AATCGAGGCC GGATACGTTA GGTCCCGCCT GCGCGGAGGT 
GACCTTGTAA TGGCTATTCG TGGCGGTATT GGAGACGTTG AAATCGTACC GGCTGACATA 
GAGGGAGCCA ACCTCACCCA GGACGCCGCG CGCATTGCTC CTCGTCATGG CGTCCTAAAC 
CGCTGGCTGC GGTACGCGCT TCAGGCTCCA TCGGTCTTCG CTCCACTCGG AGCGGGGGCA 
AATGGAGCTG CCGTCCGGGG CGTCAACATC TTTGACGTTG ATCGAGTCTT GGTTCCAGTT 
CCGCCCACGG CAGAGCAGAT TGTCATAGCT GATCGCTTAG ACATCAAGGA ACAGCAGATC 
TTACGCATGC GAGAGAAGAT TTTTGATCAT GCGAAACTGA TCCAAGAATT CCGCGCCGCC 
CTCATTACCG CCGCCGTCGC CGGTCAGATC AACGTGGATA CATGGGGTAA ACGCCGTGAG 
ACGGACCGCC GCCTCGATCG GATCGAAGAG AAGATGTCAG CCGGAGACGC GCTTGCATGA

Protein sequence

MKSLRFKNVM RERVDLSETG EETLLSVSEY YGVKPRAEAF QGEEYESRAE SLEGYRQVQR 
GDFVMNYMLA WKGAYGISEY DGIVSPAYAV FQIDKSKIDL KYLHHRTRSN PMRALFRSRS 
KGIIDSRLRL YPDALLATEI DLPGLAAQKV IADFLDRETA RIDQLIEKKE RFSALAAERW 
RATLDAEILG RTTAGKRSLT SGQPYISDVP ADWVLTPLKH LVDPRRPVMY GIVLPGPNVE 
NGIMIVKGGD VKPNRLSPDR LCKTSREIEA GYVRSRLRGG DLVMAIRGGI GDVEIVPADI 
EGANLTQDAA RIAPRHGVLN RWLRYALQAP SVFAPLGAGA NGAAVRGVNI FDVDRVLVPV 
PPTAEQIVIA DRLDIKEQQI LRMREKIFDH AKLIQEFRAA LITAAVAGQI NVDTWGKRRE 
TDRRLDRIEE KMSAGDALA