Gene EcSMS35_0887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0887
Symbol	rumB
ID	6145152
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	891150
End bp	892277
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	54%
IMG OID	641615775
Product	23S rRNA methyluridine methyltransferase
Protein accession	YP_001742967
Protein GI	170681470
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2265] SAM-dependent methyltransferases related to tRNA (uracil-5-)-methyltransferase
TIGRFAM ID	[TIGR02085] 23S rRNA (uracil-5-)-methyltransferase RumB

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.848351
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGTGCG CACTTTACGA CGCGGGTCGC TGTCGTTCCT GTCAGTGGAT AACGCAGCCG 
ATTCCAGAGC AACTCTCCGC TAAAACCGCC GATCTTAAAA ATCTGCTCGC CGATTTTCCG 
GTTGAGGAAT GGTGTGCGCC GGTGTCAGGC CCGGAACAAG GGTTTCGTAA TAAAGCCAAA 
ATGGTGGTGA GTGGTAGTGT TGAAAAACCA CTGCTCGGTA TGCTGCATCG AGATGGTACA 
CCGGAAGACC TTTGTGACTG CCCGCTTTAT CCAGCCTCAT TTGCGCCCGT TTTTGCGGCG 
CTAAAACCCT TCATCGCCCG TGCGGGGTTA ACACCTTACA ACGTGGCGCG TAAACGTGGT 
GAACTGAAAT ACATTCTGCT GACTGAAAGC CAGAGCGATG GCGGCATGAT GCTGCGTTTT 
GTACTGCGTT CTGATACCAA ACTGGCGCAA CTGCGTAAGG CGCTGCCGTG GTTACAGGAA 
CAATTACCGC AGCTGAAAGT TATTACCGTC AATATTCAGC CGGTACATAT GGCGATTATG 
GAAGGGGAGA CGGAGATCTA CCTGACCGAA CAACAGGCGC TGGCGGAGCG TTTTAACGAT 
GTGCCGCTGT GGATCCGTCC GCAAAGTTTC TTCCAGACCA ATCCGGCGGT CGCCAGCCAG 
CTTTACGCTA CCGCGCGCGA CTGGGTGCGG CAACTACCGG TAAACCATAT GTGGGATCTC 
TTCTGCGGCG TGGGGGGCTT TGGTTTACAC TGCGCGACGC CTGACATTCA GTTAACCGGG 
ATCGAAATTG CACCAGAGGC CATTGCCTGT GCGAAGCAGT CAGCCGCTGA ACTGGGCTTA 
ACGCGTTTGC AATTTCAGGC GCTGGACTCT ACGCAGTTTG CCACCGCCCA GGGGGAAGTG 
CCGGAGCTGG TGCTGGTTAA CCCGCCGCGC CGCGGCATTG GTATACCGCT GTGTGATTAT 
CTCTCAACGA TGGCACCGCG TTTTATCATA TACTCCAGCT GTAACGCCCA AACCATGGCG 
AAAGATATCC GCGAACTGCC AGGTTACCGT ATTGAACGGG TACAGCTTTT TGATATGTTC 
CCGCACACCG CGCACTATGA AGTGCTGACG CTGCTGGTGA AGCAATAA

Protein sequence

MQCALYDAGR CRSCQWITQP IPEQLSAKTA DLKNLLADFP VEEWCAPVSG PEQGFRNKAK 
MVVSGSVEKP LLGMLHRDGT PEDLCDCPLY PASFAPVFAA LKPFIARAGL TPYNVARKRG 
ELKYILLTES QSDGGMMLRF VLRSDTKLAQ LRKALPWLQE QLPQLKVITV NIQPVHMAIM 
EGETEIYLTE QQALAERFND VPLWIRPQSF FQTNPAVASQ LYATARDWVR QLPVNHMWDL 
FCGVGGFGLH CATPDIQLTG IEIAPEAIAC AKQSAAELGL TRLQFQALDS TQFATAQGEV 
PELVLVNPPR RGIGIPLCDY LSTMAPRFII YSSCNAQTMA KDIRELPGYR IERVQLFDMF 
PHTAHYEVLT LLVKQ