Gene EcSMS35_2923 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2923
Symbol	rumA
ID	6146651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2996951
End bp	2998252
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	51%
IMG OID	641617792
Product	23S rRNA 5-methyluridine methyltransferase
Protein accession	YP_001744947
Protein GI	170681551
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2265] SAM-dependent methyltransferases related to tRNA (uracil-5-)-methyltransferase
TIGRFAM ID	[TIGR00479] 23S rRNA (uracil-5-)-methyltransferase RumA

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00164007
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCAAT TCTACTCTGC AAAACGACGC ACGACGACGC GTCAGATCAT AACCGTTTCA 
GTCAATGACC TCGACTCTTT TGGTCAGGGC GTGGCGCGAC ATAACGGCAA AACGTTATTT 
ATTCCTGGAT TATTGCCACA GGAAAACGCG GAAGTTACTG TTACTGAAGA TAAAAAACAG 
TACGCCCGCG CTAAAGTCGT ACGCCGGTTA AGCGATAGCC CGGAACGCGA AACGCCACGC 
TGCCCTCATT TTGGCGTATG CGGTGGCTGT CAGCAACAAC ACGCCAGCGA GGATTTACAG 
CAGCGAAGCA AAAGTGCGGC ACTCGCCCGA TTAATGAAAC ACGAAGTCTC TGAAGTGATC 
GCCGATGTTC CCTGGGGCTA TCGCCGTCGC GCGCGTTTAA GTTTGAACTA CTTACCGAAA 
ACACAGCAAC TTCAGATGGG GTTTCGCAAA GCGGGCTCCA GTGACATTGT CGACGTTAAA 
CAATGCCCCA TTTTAGTGCC CCAACTTGAA GCATTGCTGC CCAAAGTCAG GGCATGCCTG 
GGCAGCTTAC AAGCTATGCG CCATCTTGGT CATGTTGAAC TGGTACAGGC AACCAGCGGC 
ACGCTGATGA TTTTGCGCCA TACCGCACCG CTAAGTTCGG TAGATCGCGA AAAACTGGAA 
CGCTTTTCGC ATTCTGAAGG CCTGGATCTG TATCTCGCCC CCGATAGTGA GATACTCGAA 
ACCGTCTCTG GTGAGATGCC CTGGTATGAC TCAAACGGGT TGCGCTTAAC TTTTAGCCCG 
CGCGATTTTA TTCAGGTCAA TGCGGGTGTG AACCAAAAAA TGGTAGCGCG TGCGTTGGAA 
TGGCTGGATG TACAACCTGA AGATCGCGTA CTGGATCTGT TCTGCGGTAT GGGCAACTTT 
ACACTGCCAT TGGCGACACA AGCTGCCAGT GTGGTGGGTG TAGAAGGCGT TCCGGCGCTG 
GTGGAAAAAG GCCAGCAGAA TGCGCGTCTT AATGGCTTAC ACAATGTGAC GTTTTATCAC 
GAAAATCTTG AAGAAGATGT CACAAAGCAG CCGTGGGCGA AAAACGGCTT CGATAAAGTG 
TTGCTGGACC CGGCGCGAGC AGGTGCCGCA GGTGTTATGC AGCAAATTAT AAAACTGGAA 
CCTATTCGTA TAGTTTATGT ATCCTGTAAT CCTGCAACGC TGGCTCGGGA TAGCGAAGCG 
TTATTAAAAG CAGGATATAC CATTGCGCGA CTGGCGATGC TGGATATGTT CCCACACACG 
GGACATCTGG AATCGATGGT ACTTTTCTCG CGCGTTAAAT AG

Protein sequence

MAQFYSAKRR TTTRQIITVS VNDLDSFGQG VARHNGKTLF IPGLLPQENA EVTVTEDKKQ 
YARAKVVRRL SDSPERETPR CPHFGVCGGC QQQHASEDLQ QRSKSAALAR LMKHEVSEVI 
ADVPWGYRRR ARLSLNYLPK TQQLQMGFRK AGSSDIVDVK QCPILVPQLE ALLPKVRACL 
GSLQAMRHLG HVELVQATSG TLMILRHTAP LSSVDREKLE RFSHSEGLDL YLAPDSEILE 
TVSGEMPWYD SNGLRLTFSP RDFIQVNAGV NQKMVARALE WLDVQPEDRV LDLFCGMGNF 
TLPLATQAAS VVGVEGVPAL VEKGQQNARL NGLHNVTFYH ENLEEDVTKQ PWAKNGFDKV 
LLDPARAGAA GVMQQIIKLE PIRIVYVSCN PATLARDSEA LLKAGYTIAR LAMLDMFPHT 
GHLESMVLFS RVK