Gene Msil_3571 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3571
Symbol
ID	7092430
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	3931098
End bp	3932474
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	56%
IMG OID	643466863
Product	hypothetical protein
Protein accession	YP_002363822
Protein GI	217979675
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGATG GCCTTCGCCC TTACGCCGAC ACAAATCCGA CCGGTCTGCC ATGGCTCGGT 
GACGTGCCGG CGCATTGGAA TGTTCGGCGT ATCAAAACGC TGCTTAGGGA GGTCGATAGT 
CGCAGCAAGA CAGGAGAAGA ACGGCTTCTG TCGCTGAGAA TGAGACAAGG GCTTGTCGAT 
CACATCGATG CGGGCGGGAA GCTGATCCCG CCGGAGTCAC TGGTTAATTT CAAGATCGTC 
GAGCCCGGAC AGGTGGTCAT GAACCGCATG AGGGCCGCTG CCGGTTTGTT CGGCGTTGCG 
AATGTGCGCG GATTGGTGAG CCCGGACTAC GCCGTCTTCG AACCATTGCC CGAAGCGTTC 
AATCCCTACC TCCTTCAAGC ATTCCGATTG CCGTCACTGT CAGCGGTGTT CCGAGCGGAA 
TCGAAGGGCT TAGGCACCGG AGAATCCGGG TTCCTTCGCC TTTACACAGA TAGGTTCGGC 
CCGATCCCTG TTCCCTATCC GCCGCTCGAT GAGCAGCGGC TGATTGTGCG GTTTCTGGAT 
TGGCATGGGG CGCAGACGGC GAAGCTGATC CGCGCGAAGA AGAAGATCAT CGCGCTTCTG 
AACGAGCAGA AGCAGGCGAT CATCCACCGC GCCGTCACCC GCGGCCTCGA TCCCAATGTC 
CGCCTCAAGC CCTCAGGCAT CCCTTGGCTC GGCGACATCC CTGAAGATTG GGAGGTTTCG 
CGCGTAAAGA CTGAGTTTCA GTGCCTCAAC TACCGACGAG TTCCGTTAAG TGGCACAGAG 
CGGGGACGAA TGACTGTTCG CCAATACGAT TACTACGGGG CATCAGGAGT AATCGATAAG 
GTCGACGAAT TTTTGTTCGA CGACAAACTT CTGCTGATAG CGGAAGATGG CGCAAATTTG 
GTCCTTAGAA ACCTCCCTTT AGCGATCATC GCCGAAGGAA AGTTTTGGGT AAACAACCAC 
GCTCATATTT TGAAGCCTCG TCGTGGGGAC ATTCGATTTC TCGCCGCAAT TCTTGAGGGA 
CTGAATTTCC TTCCATGGAT ATCCGGCGCA GCACAACCAA AACTAACTCA GGATCGCCTT 
ATGGGGATCG CAATCGCAGT TCCGCCTGGG CACAAGCAGC TAGAAATCAT TCAAAGCTGC 
GATGAGGAAG TGTCCGAACT GGTCCGCGCG ATAAACGTGG CAAGTAAAGA GCTTATCTTT 
ATTCAGGAAT TCCGCACCCG CCTGATAGCC GATGTCGTTA CCGGTAAGCT CGACGTGAGG 
GCCGCTGCGG CCAGCCTGCC TGAATCCGCC GAACTTGAGG CCACCGAAGA GCTTGTTGAG 
GACGACGATC TCGACGAAGC CATTGACGAT GCCGAAAATA AGGAGGTTGC CGCCTGA

Protein sequence

MIDGLRPYAD TNPTGLPWLG DVPAHWNVRR IKTLLREVDS RSKTGEERLL SLRMRQGLVD 
HIDAGGKLIP PESLVNFKIV EPGQVVMNRM RAAAGLFGVA NVRGLVSPDY AVFEPLPEAF 
NPYLLQAFRL PSLSAVFRAE SKGLGTGESG FLRLYTDRFG PIPVPYPPLD EQRLIVRFLD 
WHGAQTAKLI RAKKKIIALL NEQKQAIIHR AVTRGLDPNV RLKPSGIPWL GDIPEDWEVS 
RVKTEFQCLN YRRVPLSGTE RGRMTVRQYD YYGASGVIDK VDEFLFDDKL LLIAEDGANL 
VLRNLPLAII AEGKFWVNNH AHILKPRRGD IRFLAAILEG LNFLPWISGA AQPKLTQDRL 
MGIAIAVPPG HKQLEIIQSC DEEVSELVRA INVASKELIF IQEFRTRLIA DVVTGKLDVR 
AAAASLPESA ELEATEELVE DDDLDEAIDD AENKEVAA