Gene EcSMS35_1352 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1352
Symbol	yebU
ID	6147046
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1338431
End bp	1339876
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	53%
IMG OID	641616230
Product	rRNA (cytosine-C(5)-)-methyltransferase RsmF
Protein accession	YP_001743410
Protein GI	170683942
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00446] NOL1/NOP2/sun family putative RNA methylase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.312061
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0948873
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGTGG CCCAACACAC CGTTTATTTC CCGGACGCCT TTCTGACACA AATGCGCGAA 
GCTATGCCTT CGACGCTCTC TTTTGATGAT TTTCTTGCCG CCTGTCAGCG CCCGTTGCGC 
CGCAGCATTC GCGTTAATAC GCTGAAAATC TCCGTTGCTG ATTTCCTGCA ATTAACCGCT 
CCTTATGGCT GGACGCTTAC GCCAATTCCG TGGTGTGAAG AAGGTTTCTG GATTGAACGC 
GACGATGAAG ATGCATTGCC ATTGGGTAGT ACCGCCGAGC ATTTAAGCGG CCTGTTTTAT 
ATTCAGGAAG CCAGTTCAAT GTTGCCCGTT GCCGCCTTGT TTGCTGACGG TAATGCACCA 
CAGCGGGTGA TGGATGTCGC TGCCGCGCCC GGCTCCAAAA CGACGCAAAT TGCCGCGCGG 
ATGAATAACG AAGGGGCGAT CCTTGCCAAT GAGTTTTCCG CCAGTCGGGT AAAAGTGTTA 
CATGCCAATA TCAGCCGCTG TGGCATCAGT AATGTTGCGC TCACACATTT TGATGGCCGC 
GTGTTTGGTG CGGCAGTGCC AGAAATGTTC GATGCCATTT TGCTGGACGC TCCCTGCTCC 
GGCGAAGGCG TGGTGCGTAA AGATCCCGAT GCGCTAAAAA ACTGGTCACC AGAAAGCAAT 
CAGGAAATCG CAGCGACCCA ACGGGAACTG ATCGACAGCG CCTTTCATGC ATTACGCCCT 
GGCGGTACGC TGGTTTACTC GACCTGTACC TTAAACAGGG AAGAAAACGA AGCCGTTTGC 
CTGTGGCTGA AAGAGACTTA CCCCGACGCA GTAGAGTTTT TACCGCTTGG CGATCTCTTC 
CCTGGTGCAA ATAAGGCGCT GACCGAAGAA GGCTTTTTGC ATGTTTTCCC ACAAATTTAC 
GACTGCGAAG GCTTCTTCGT TGCTCGTCTG CGTAAAACTC AGGCGATCCC CGTCTTACCC 
GCCCCAAAAT ACAAAGTGGG CAATTTCCCG TTTAGCCCGG TGAAAGATCG CGAAGCCGGT 
CAAATTCGTC AGGCGGCTGC AGGTGTTGGC TTAAACTGGG ATGGAAACCT GCGACTCTGG 
CAACGCGACA AAGAACTGTG GTTGTTCCCG GTAGGCATTG AAGCCCTGAT CGGTAAAGTC 
CGATTTTCTC GGTTGGGGAT TAAACTTGCC GAAACGCATA ACAAAGGTTA TCGCTGGCAG 
CATGAAGCGG TTATTGCCCT TGCCTCCCCC GACAATGTGA ACGCTTTTGA ACTGACACCG 
CAGGAAGCGG AAGAGTGGTA TCGCGGGCGC GATGTTTACC CGCAAGCCGC GCCAGTAGCG 
GATGATGTAT TGGTTACTTT CCAGCATCAG CCGATTGGTT TAGCCAAACG AATTGGTTCG 
CGACTGAAAA ACAGCTACCC GCGTGAACTG GTGCGAGACG GGAAACTTTT TACCGGTAAC 
GCCTGA

Protein sequence

MLVAQHTVYF PDAFLTQMRE AMPSTLSFDD FLAACQRPLR RSIRVNTLKI SVADFLQLTA 
PYGWTLTPIP WCEEGFWIER DDEDALPLGS TAEHLSGLFY IQEASSMLPV AALFADGNAP 
QRVMDVAAAP GSKTTQIAAR MNNEGAILAN EFSASRVKVL HANISRCGIS NVALTHFDGR 
VFGAAVPEMF DAILLDAPCS GEGVVRKDPD ALKNWSPESN QEIAATQREL IDSAFHALRP 
GGTLVYSTCT LNREENEAVC LWLKETYPDA VEFLPLGDLF PGANKALTEE GFLHVFPQIY 
DCEGFFVARL RKTQAIPVLP APKYKVGNFP FSPVKDREAG QIRQAAAGVG LNWDGNLRLW 
QRDKELWLFP VGIEALIGKV RFSRLGIKLA ETHNKGYRWQ HEAVIALASP DNVNAFELTP 
QEAEEWYRGR DVYPQAAPVA DDVLVTFQHQ PIGLAKRIGS RLKNSYPREL VRDGKLFTGN 
A