Gene SbBS512_E2103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2103
Symbol	yebU
ID	6273013
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	1913037
End bp	1914482
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	52%
IMG OID	641726140
Product	rRNA (cytosine-C(5)-)-methyltransferase RsmF
Protein accession	YP_001880634
Protein GI	187732363
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00446] NOL1/NOP2/sun family putative RNA methylase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.0235271
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCGTGG CCCAACACAC CGTTTATTTC CCGGACGCGT TTCTGACACA AATGCGCGAA 
GCTATGCCTT CGACGCTCTC ATTTGATGAT TTTCTTGCCG CCTGTCAGCG CCCGTTGCGC 
CGCAGCATTC GCGTTAATAC GCTGAAAATC TCCGTTGCTG ATTTCCTGCA ATTAACCGCT 
CCTTATGGCT GGACGCTTAC GCCAATTCCG TGGTGTGAAG AAGGTTTCTG GATTGAACGC 
GACAATGAAG ATGCATTGCC ATTGGGTAGT ACCGCCGAGC ATTTAAGTGG CCTGTTTTAT 
ATTCAGGAAG CCAGTTCAAT GTTGCCCGTC GCCGCCTTGT TTGCTGACGG TAATGCACCA 
CAGCGGGTGA TGGATGTCGC TGCTGCGCCA GGCTCAAAAA CGACGCAAAT TGCCGCGCGG 
ATGAATAACG AAGGGGCAAT CCTTGCCAAT GAGTTTTCCG CCAGTCGGGT AAAAGTGTTA 
CATGCCAATA TCAGCCGCTG TGGCATCAGT AATGTTGCGC TCACACATTT TGATGGCCGC 
GTGTTTGGTG CGGCAGTGCC AGAAATGTTT GATGCCATTT TGCTGGACGC TCCCTGCTCC 
GGCGAAGGCG TGGTGCGTAA AGATCCCGAT GCGCTAAAAA ACTGGTCACC AGAAAGCAAT 
CAGGAAATCG CAGCTACACA ACGGGAGCTT ATCGACAGCG CCTTTCATGC ATTACGTCCT 
GGTGGTACGC TGGTTTACTC GACCTGTACC TTAAACCAGG AAGAAAACGA AGCCGTTTGC 
CTGTGGCTGA AAGAGACTTA CCCCGACGCA GTAGAGTTTT TACCACTTGG CGATCTCTTC 
CCTGGTGCAA ACAAAGCGCT GACCGAAGAA GGCTTTTTGC ATGTTTTCCC ACAAATTTAC 
GACTGCGAAG GCTTCTTCGT TGCTCGTCTG CGTAAAACTC AGGCGATTCC CGCCTTACCC 
GCCCCCAAAT ACAAAGTCGG TAATTTTCCG TTCAGCCCGG TGAAAGATCG CGAAGCTGGA 
CAAATTCGCC AGGCGGCTGC AGATGTTGGC TTAAACTGGG ATGAAAACCT GCGCCTCTGG 
CAGCGTGACA AAGAACTGTG GTTGTTCCCG GTGGGCATTG AAGCCCTGAT CGGTAAAGTC 
CGATTTTCTC GCTTGGGGAT TAAACTTGCC GAAACGCACA ACAAAGGTTA TCGCTGGCAG 
CATGAAGCAG TTATTGCCCT TGCCACCCCC GACAATGTGA ACGCTTTTGA ACTGACACCG 
CAGGAAGCGG AGGAGTGGTA TCGCGGGCGC GATGTTTACC CGCAAGCCGC GCCAGTGGCG 
GATGACGTGT TGGTTACTTT CCAGCATCAA CCGATTGGTT TAGCCAAACG GATTGGTTCG 
CGATTGAAAA ACAGCTATCC GCGTGAACTG GTGCGCGATG GGAAACTTTT TACCGGTAAC 
GCCTGA

Protein sequence

MLVAQHTVYF PDAFLTQMRE AMPSTLSFDD FLAACQRPLR RSIRVNTLKI SVADFLQLTA 
PYGWTLTPIP WCEEGFWIER DNEDALPLGS TAEHLSGLFY IQEASSMLPV AALFADGNAP 
QRVMDVAAAP GSKTTQIAAR MNNEGAILAN EFSASRVKVL HANISRCGIS NVALTHFDGR 
VFGAAVPEMF DAILLDAPCS GEGVVRKDPD ALKNWSPESN QEIAATQREL IDSAFHALRP 
GGTLVYSTCT LNQEENEAVC LWLKETYPDA VEFLPLGDLF PGANKALTEE GFLHVFPQIY 
DCEGFFVARL RKTQAIPALP APKYKVGNFP FSPVKDREAG QIRQAAADVG LNWDENLRLW 
QRDKELWLFP VGIEALIGKV RFSRLGIKLA ETHNKGYRWQ HEAVIALATP DNVNAFELTP 
QEAEEWYRGR DVYPQAAPVA DDVLVTFQHQ PIGLAKRIGS RLKNSYPREL VRDGKLFTGN 
A