Gene EcSMS35_3584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3584
Symbol	rsmB
ID	6146958
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3662442
End bp	3663731
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	50%
IMG OID	641618411
Product	16S rRNA methyltransferase B
Protein accession	YP_001745551
Protein GI	170684100
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00563] ribosomal RNA small subunit methyltransferase RsmB

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.287379
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.154829
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAC AACGTAATTT ACGTAGCATG GCGGCCCAGG CCGTTGAACA AGTCGTCGAG 
CAAGGGCAAT CATTAAGCAA CATTCTGCCA CCGCTCCAGC AAAAAGTTTC TGATAAAGAC 
AAAGCACTTC TTCAAGAGTT GTGCTTTGGC GTACTGCGTA CGCTTTCACA GTTAGACTGG 
CTGATTAATA AGCTAATGGC CCGTCCGATG ACAGGCAAAC AGCGTACTGT TCATTACCTG 
ATTATGGTTG GTTTGTATCA ACTGCTTTAT ACCCGCATTC CACCTCATGC CGCGCTGGCT 
GAAACGGTTG AAGGCGCTAT CGCAATTAAG CGCCCGCAAC TTAAAGGGTT GATAAACGGT 
GTATTACGCC AGTTCCAGCG TCAGCAAGAA GAGTTATTAG CCGAGTTTAA TGCCAGTGAT 
GCACGTTATC TGCATCCTTC CTGGTTGCTG AAGCGTCTGC AAAAAGCGTA TCCAGAGCAG 
TGGCAATCCA TCGTCGAAGC CAATAACCAG CGTCCGCCAA TGTGGCTGCG CGTTAATCGT 
ACGCATCATT CCCGCGACAG GTGGCTTGCA TTGCTGGATG AAGCAGGAAT GAAAGGTTTC 
CCGCATGCGG ATTACCCTGA TGCTGTACGT CTGGAAACAC CTGCACCTGT TCATGCGCTA 
CCTGGTTTTG AAGACGGATG GGTTACCGTT CAGGATGCCT CAGCACAAGG TTGCATGACC 
TGGCTTGCGC CACAAAACGG TGAACACATT TTGGATCTTT GTGCCGCCCC CGGCGGTAAA 
ACAACGCATA TCCTTGAGGT GGCACCAGAA GCGCAGGTTG TTGCGGTTGA TATTGACGAA 
CAGCGCCTCT CTCGCGTTTA CGACAATTTA AAACGCCTTG GTATGAAGGC AACCGTGAAA 
CAAGGTGATG GCCGTTACCC TTCCCAATGG TGTGGCGAGC AACAGTTTGA TCGCATTTTA 
TTAGATGCGC CTTGTTCAGC AACCGGTGTG ATTCGTCGCC ATCCGGATAT TAAATGGTTA 
CGTCGCGATC GCGATATCCC GGAACTCGCG CAATTGCAGT CTGAAATTCT CGACGCCATT 
TGGCCGCATT TAAAATCCGG TGGAACCCTG GTCTATGCCA CCTGTTCGGT GTTACCGGAA 
GAGAATAGCC TGCAGATTAA AGCCTTTTTG CAACGTACTG CTGATGCCGA ACTTTGCGAA 
ACAGGAACAC CAGAGCAACC GGGTAAACAA AATCTACCTG GTGCCGAAGA GGGCGACGGC 
TTCTTTTACG CTAAGCTAAT CAAAAAGTGA

Protein sequence

MKKQRNLRSM AAQAVEQVVE QGQSLSNILP PLQQKVSDKD KALLQELCFG VLRTLSQLDW 
LINKLMARPM TGKQRTVHYL IMVGLYQLLY TRIPPHAALA ETVEGAIAIK RPQLKGLING 
VLRQFQRQQE ELLAEFNASD ARYLHPSWLL KRLQKAYPEQ WQSIVEANNQ RPPMWLRVNR 
THHSRDRWLA LLDEAGMKGF PHADYPDAVR LETPAPVHAL PGFEDGWVTV QDASAQGCMT 
WLAPQNGEHI LDLCAAPGGK TTHILEVAPE AQVVAVDIDE QRLSRVYDNL KRLGMKATVK 
QGDGRYPSQW CGEQQFDRIL LDAPCSATGV IRRHPDIKWL RRDRDIPELA QLQSEILDAI 
WPHLKSGGTL VYATCSVLPE ENSLQIKAFL QRTADAELCE TGTPEQPGKQ NLPGAEEGDG 
FFYAKLIKK