Gene Msil_1597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_1597
Symbol
ID	7090954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	1723021
End bp	1724160
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	64%
IMG OID	643464923
Product	DNA methylase N-4/N-6 domain protein
Protein accession	YP_002361908
Protein GI	217977761
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.111041
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGTACTG AGACCGGAGC GTTTTCCGCG CCTCTCCCGG CGGATTGTTC TCCCGCGCTT 
CCGCTCAATG AAATCCTGAT CGGCGACTGC CTCGAGCAGC TGGCGCGCCT GCCTGCGGCC 
TCGGTCGACG CCGTCTTCGC CGATCCGCCC TATAATCTGC AGCTCGAATC GACGCTGTCG 
CGGCCGGATC AGAGCCTCGT CGACGCCGTC AACGACGATT GGGACAAGTT CGACAGCTTC 
TCCCATTATG ATTCCTTCAG CAGGTCATGG CTCAAGGCCG TGCGCCGCGT CATGAAGCCC 
GAAGCGACGC TGTTCGTGAT CGGCTCCTAT CACAATATTT TCCGGGTCGG CTCGACGCTG 
CAGGACGAAG GCTTTTGGAT CTTGAACGAC ATCGTCTGGC GCAAGGCCAA TCCGATGCCG 
AACTTTCGCG GACGCCGCTT CACCAACGCC CATGAAACCC TGATCTGGGC CGCGAAGGAT 
TCCGCCGCCA AAAACTACCG CTTCAATTAT GAGCTTCTGA AAGCGGGCAA TGAGGATTGC 
CAGCTCCGCT CGGACTGGCT TTTCCCGATC TGCACCGGCG CCGAACGGCT GAAAGGTTCG 
GACGGGCGCA AGACGCATCC GACGCAAAAG CCGGAAGCTT TGCTGGCCCG TATCCTGATC 
GCCGCGACGA ACCCCGGCGA TGTCGTGCTC GACCCGTTCT TCGGCTCGGG CACCACGGGC 
GCCGCCGCGA AACGGCTCGG GCGGCATTTC GTCGGCATCG AGCGTGATAA AACCTACGCC 
GCCGCCGCGC GGGCGCGCAT CGACGCCGTC GAGACTCTGC CCGAAGCAGC AATCGCGCTG 
ACGCCGAGCA AGCGCACCGA GCCGCGCGTC GCCTTTTCGG CAATCGTTGA GGCCGGGCTG 
ATCGCGCCCG GCGACAGTCT CGTCGACGAC AAGCAGCGTC ATCGCGCGAC CGTGAGGGCC 
GACGGCGCCA TCACGCTTGG GCCGGTCGTC GGCTCGATCC ACAAAATCGG CGCGCTGGCG 
CAGGGCCTGC CGGCTTGCAA CGGCTGGACC TATTGGCACT TCGCACAAGG CGGCAAATTG 
CAGCCGATCG ACGCGCTGCG CACGGTGGCG CGCGGAAAAC TGCGCGAGGC CGAAGCCTGA

Protein sequence

MRTETGAFSA PLPADCSPAL PLNEILIGDC LEQLARLPAA SVDAVFADPP YNLQLESTLS 
RPDQSLVDAV NDDWDKFDSF SHYDSFSRSW LKAVRRVMKP EATLFVIGSY HNIFRVGSTL 
QDEGFWILND IVWRKANPMP NFRGRRFTNA HETLIWAAKD SAAKNYRFNY ELLKAGNEDC 
QLRSDWLFPI CTGAERLKGS DGRKTHPTQK PEALLARILI AATNPGDVVL DPFFGSGTTG 
AAAKRLGRHF VGIERDKTYA AAARARIDAV ETLPEAAIAL TPSKRTEPRV AFSAIVEAGL 
IAPGDSLVDD KQRHRATVRA DGAITLGPVV GSIHKIGALA QGLPACNGWT YWHFAQGGKL 
QPIDALRTVA RGKLREAEA