Gene EcHS_A1926 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1926
Symbol	yebU
ID	5592630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1939194
End bp	1940639
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	52%
IMG OID	640921069
Product	rRNA (cytosine-C(5)-)-methyltransferase RsmF
Protein accession	YP_001458620
Protein GI	157161302
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00446] NOL1/NOP2/sun family putative RNA methylase

Plasmid Coverage information

Num covering plasmid clones	42
Plasmid unclonability p-value	0.79578
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCGTGG CCCAACACAC CGTTTATTTC CCGGACGCCT TTCTGACGCA AATGCGCGAA 
GCGATGCCTT CGACGCTCTC TTTTGATGAT TTTCTTGCCG CCTGTCAGCG CCCGTTGCGC 
CGCAGCATTC GCGTTAATAC GCTGAAAATC TCCGTTGCTG ATTTCCTGCA ATTAACCGCT 
CCTTATGGCT GGACGCTTAC GCCAATTCCG TGGTGTGAAG AAGGTTTCTG GATTGAACGC 
GACAATGAAG ATGCATTGCC ATTGGGTAGT ACCGCCGAGC ATTTAAGCGG CCTGTTTTAT 
ATTCAGGAAG CCAGTTCAAT GTTGCCCGTC GCCGCCTTGT TTGCTGACGG TAATGCACCA 
CAGCGGGTGA TGGATGTCGC TGCTGCGCCA GGCTCCAAAA CGACGCAAAT TGCCGCACGG 
ATGAATAACG AAGGGGCAAT CCTTGCCAAT GAGTTTTCCG CCAGTCGGGT AAAAGTGTTA 
CATGCCAATA TCAGCCGCTG TGGCATCAGT AATGTTGCGC TCACACATTT TGATGGCCGC 
GTGTTTGGTG TGGCAGTGCC AGAAATGTTC GATGCCATTT TGCTGGACGC TCCCTGCTCT 
GGCGAAGGCG TGGTGCGTAA AGATCCCGAT GCGCTAAAAA ACTGGTCACC AGAAAGCAAT 
CAGGAAATCG CAGCTACACA ACGGGAGCTT ATCGACAGCG CCTTTCATGC ATTACGTCCT 
GGTGGTACGC TGGTTTACTC GACCTGTACC TTAAACAGGG AAGAAAACGA AGCCGTTTGC 
ATGTGGCTGA AAGAGACTTA CCCTGACGCA GTAGAGTTTT TACCACTTGG CGAGCTCTTC 
CCTGCTGCAA ACAAAGCGCT GACCGAAGAA GGCTTTTTGC ATGTTTTCCC ACAAATTTAC 
GACTGCGAAG GCTTCTTCGT TGCTCGTCTG CGTAAAACTC AGGCCATTCC CGCCTTACCC 
GCCCCCAAAT ACAAAGTCGG TAATTTTCCG TTCAGCCCGG TGAAAGATCG CGAAGCTGGA 
CAAATTCGTC AGGCGGCTGC AGGTGTTGGC TTAAACTGGG ATGAAAACCT GCGCCTCTGG 
CAGCGTGACA AAGAACTGTG GTTGTTCCCG GTGGGCATTG AAGCCCTGAT CGGTAAAGTC 
CGATTTTCTC GCTTGGGGAT TAAACTTGCC GAAACGCACA ACAAAGGTTA TCGCTGGCAG 
CATGAAGCAG TTATTGCCCT TGCCACCCCC GACAATGTGA ACGCTTTTGA ACTGACACCG 
CAGGAAGCGG AGGAGTGGTA TCGCGGGCGC GATGTTTACC CGCAAGCCGC GCCAGTGGCG 
GATGACGTGT TGGTTACTTT CCAGCATCAG CCGATTGGTT TAGCCAAACG GATTGGTTCG 
CGACTGAAAA ACAGCTACCC GCGTGAACTG GTGCGGGACG GGAAACTTTT TACCAGTAAC 
GCATGA

Protein sequence

MLVAQHTVYF PDAFLTQMRE AMPSTLSFDD FLAACQRPLR RSIRVNTLKI SVADFLQLTA 
PYGWTLTPIP WCEEGFWIER DNEDALPLGS TAEHLSGLFY IQEASSMLPV AALFADGNAP 
QRVMDVAAAP GSKTTQIAAR MNNEGAILAN EFSASRVKVL HANISRCGIS NVALTHFDGR 
VFGVAVPEMF DAILLDAPCS GEGVVRKDPD ALKNWSPESN QEIAATQREL IDSAFHALRP 
GGTLVYSTCT LNREENEAVC MWLKETYPDA VEFLPLGELF PAANKALTEE GFLHVFPQIY 
DCEGFFVARL RKTQAIPALP APKYKVGNFP FSPVKDREAG QIRQAAAGVG LNWDENLRLW 
QRDKELWLFP VGIEALIGKV RFSRLGIKLA ETHNKGYRWQ HEAVIALATP DNVNAFELTP 
QEAEEWYRGR DVYPQAAPVA DDVLVTFQHQ PIGLAKRIGS RLKNSYPREL VRDGKLFTSN 
A