Gene ECH74115_4045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4045
Symbol	rumA
ID	6971254
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3740495
End bp	3741796
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	51%
IMG OID	643387807
Product	23S rRNA 5-methyluridine methyltransferase
Protein accession	YP_002272250
Protein GI	209399664
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2265] SAM-dependent methyltransferases related to tRNA (uracil-5-)-methyltransferase
TIGRFAM ID	[TIGR00479] 23S rRNA (uracil-5-)-methyltransferase RumA

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000364507
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.378409
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCAAT TCTACTCTGC AAAACGACGC ACGACGACGC GTCAGATCAT AACCGTTTCA 
GTCAACGACC TCGACTCTTT TGGTCAGGGC GTGGCGCGAC ATAACGGCAA AACGCTATTT 
ATCCCCGGAT TATTGCCGCA GGAAAACGCG GAAGTTACTG TTACTGAGGA TAAAAAACAG 
TATGCCCGCG CTAAAGTCGT ACGCCGGTTA AGCGATAGCC CGGAACGCGA AACGCCACGC 
TGTCCTCATT TTGGCGTATG CGGCGGCTGT CAGCAACAAC ACGCCAGCGT GGATTTACAG 
CAGCGAAGCA AAAGTGCGGC ACTCGCCCGA TTAATGAAAC ACGAAGTCTC TGAAGTGATC 
GCCGATGTTC CCTGGGGCTA TCGCCGTCGC GCGCGTTTAA GTCTGAACTA CTTACCGAAA 
ACACAGCAAC TTCAGATGGG GTTTCGCAAA GCGGGCTCCA GTGACATTGT CGACGTTAAA 
CAATGTCCCA TTTTAGTGCC CCAACTTGAA GCATTGCTGC CCAAAGTCAG GGCATGCCTG 
GGCAGCTTAC AAGCTATGCG CCATCTTGGT CATGTTGAAC TGGTACAGGC AACCAGCGGC 
ACGCTGATGA TTTTGCGCCA TACCGCACCG CTAAGTTCGG CAGATCGCGA AAAACTGGAA 
CGCTTTTCGC ATTCTGAAGG CCTGGATCTG TATCTCGCCC CCGATAGTGA GATACTCGAA 
ACCGTCTCTG GTGAGATGCC CTGGTATGAC TCAAACGGGT TGCGCTTAAC TTTTAGCCCG 
CGCGATTTTA TTCAGGTTAA TGCGGGTGTG AACCAAAAAA TGGTAGCGCG TGCGTTGGAA 
TGGCTGGAGG TGGAACCTGA AGATCGCGTA CTGGATCTGT TCTGCGGTAT GGGCAACTTT 
ACACTACCAT TGGCGACACA AGCTGCCAGT GTGGTGGGTG TAGAAGGTGT TCCGGCGCTG 
GTGGAAAAAG GCCAGCAGAA TGCGCGTCTT AACTGCTTAC AGAATGTGAC GTTTTATCAC 
GAAAATCTTG AAGAAGATGT CACAAAGCAG CCGTGGGCGA AAAACGGCTT CGATAAAGTG 
TTGCTGGACC CGGCGCGAGC AGGTGCCGCA GGTGTTATGC AGCAAATTAT AAAACTGGAA 
CCTATTCGTA TAGTTTATGT ATCCTGTAAC CCTGCAACGC TGGCTCGGGA TAGCGAAGCG 
TTATTAAAAG CAGGATATAC CATTGCGCGA CTGGCGATGC TGGATATGTT CCCACACACG 
GGACATCTGG AATCGATGGT ACTTTTCTCG CGCGTTAAAT AG

Protein sequence

MAQFYSAKRR TTTRQIITVS VNDLDSFGQG VARHNGKTLF IPGLLPQENA EVTVTEDKKQ 
YARAKVVRRL SDSPERETPR CPHFGVCGGC QQQHASVDLQ QRSKSAALAR LMKHEVSEVI 
ADVPWGYRRR ARLSLNYLPK TQQLQMGFRK AGSSDIVDVK QCPILVPQLE ALLPKVRACL 
GSLQAMRHLG HVELVQATSG TLMILRHTAP LSSADREKLE RFSHSEGLDL YLAPDSEILE 
TVSGEMPWYD SNGLRLTFSP RDFIQVNAGV NQKMVARALE WLEVEPEDRV LDLFCGMGNF 
TLPLATQAAS VVGVEGVPAL VEKGQQNARL NCLQNVTFYH ENLEEDVTKQ PWAKNGFDKV 
LLDPARAGAA GVMQQIIKLE PIRIVYVSCN PATLARDSEA LLKAGYTIAR LAMLDMFPHT 
GHLESMVLFS RVK