Gene Msil_3158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3158
Symbol
ID	7093818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	+
Start bp	3471953
End bp	3473371
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	67%
IMG OID	643466467
Product	transcriptional regulator, XRE family
Protein accession	YP_002363428
Protein GI	217979281
COG category	[R] General function prediction only
COG ID	[COG3800] Predicted transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAATG TCCGCCCCGT CTTTATGGGG CCCCGCCTGC GCCGGCTGCG CCGGGATCTT 
GGCCTCACTC AGGCTAATAT GGCTACGGAT CTCGATATTT CAGCCTCTTA TGTCGCCTTG 
CTGGAGCGCA ATCAGCGCCC CTTGACCGCC GACATGCTGC TGCGCCTCGC CCGCACTTAT 
AAGATCGACA TGAGCGATCT CGCCGGAGAC AGCGCCGCCG AATATACCGG CCGTCTTCAA 
ACCGTCCTGA AAGATCCGAT GTTCTCGGAC ATCGATCTGC CCCCGCTCGA AACCGAGGAC 
GTCGCCACCA GCTACCCCGG CGTCACGGAA GCGCTGCTGC GGCTTTATTC GGCCTATAAG 
GAAGAACAGC TGGCGCTGGC CGATCGCGGC GCCGAGAGCC GTGGCGGCGC AGACCGGGGC 
GCGGATGCGC CGGACCCTGT CGCTGAAGCC AGGCGCTTTC TCGCTGCCCG CCGCAATAGT 
TTTCCGGGCC TCGACAACGC CGCCGAGCGC CTCGCCCAGA CCGTGAGCGG ACGCGCCGGC 
GTCATCGGCC ATTTGCGCGC CCGGCACCAT CTGGGCGTCC GGCGTCTGCC CTCCGAGGTC 
ATGGTCGGTT CAACGCGGCG GCTCGACCGC CATCGCGACG AGATCCTGCT CGACGATTCG 
CTGGACGCGG CAAGCCAGAC CTTCCAGCTG GCGCTTCAGT TGATCTATCT CGAAATGTCG 
GACGAGATCG ACGCCGTGCT GCGGGAAGGC AGCTTCGCCA CGCAAAGCGG CGAGCGCCTG 
ACGCGGCGGG CGCTGGCGAG CTACGCCGCC GCCGCTTTGA TCATGCCCTA TTCCGCCTTC 
GCCAGGGCGG TCGAAGCGCG GCGCTACGAT GTCGAGGCGC TGGCGCGCCA GTTCGGCGCT 
AGCTTCGAGC AGACCGCGCA TCGGCTGACC ACGTTGCAGA AGCCGGGGCA GGAGCGGGTG 
CCGTTCTTTT TTATCCGGGT CGATCCGGCC GGCAATGTGT CGAAGCGGCT GGACGGCGCC 
GGCTTTCCCT TTGCCCGCCA TGGCGGCGCC TGCCCGCTCT GGTCGATCCA CAATGTGTTC 
CGCACGCCGC GCCAGATCGT CACCCAATGG CTGGAATTGC CCGACGGTCA GCGGTTCTTC 
TCGATCGCCC GCACGGTGAC GGCCGGGGGA GGCGCCTATG GCGCGCAGCG CGTCGAGCGC 
GCCATCGCGC TTGGCTGCGC CGCCGAACAC GCCGGCCAGC TGATTTATAC GCAGGACCAG 
CCGGACTTCA GCGCCGTTGC GGCGACGCCA ATCGGCGTCA CCTGCCGTCT CTGCCACCGC 
ACCAATTGCA CCGCGCGATC GGCGCCGCTG ATCGGCCGGC AGGTGCTCCC CGACGATTAC 
CGTCGCGCCA GCGCGCCTTT CGGCTTTTCG GACAGTTGA

Protein sequence

MPNVRPVFMG PRLRRLRRDL GLTQANMATD LDISASYVAL LERNQRPLTA DMLLRLARTY 
KIDMSDLAGD SAAEYTGRLQ TVLKDPMFSD IDLPPLETED VATSYPGVTE ALLRLYSAYK 
EEQLALADRG AESRGGADRG ADAPDPVAEA RRFLAARRNS FPGLDNAAER LAQTVSGRAG 
VIGHLRARHH LGVRRLPSEV MVGSTRRLDR HRDEILLDDS LDAASQTFQL ALQLIYLEMS 
DEIDAVLREG SFATQSGERL TRRALASYAA AALIMPYSAF ARAVEARRYD VEALARQFGA 
SFEQTAHRLT TLQKPGQERV PFFFIRVDPA GNVSKRLDGA GFPFARHGGA CPLWSIHNVF 
RTPRQIVTQW LELPDGQRFF SIARTVTAGG GAYGAQRVER AIALGCAAEH AGQLIYTQDQ 
PDFSAVAATP IGVTCRLCHR TNCTARSAPL IGRQVLPDDY RRASAPFGFS DS