Gene EcSMS35_4918 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4918
Symbol	rsmC
ID	6143662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	5035035
End bp	5036066
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	55%
IMG OID	641619721
Product	16S ribosomal RNA m2G1207 methyltransferase
Protein accession	YP_001746825
Protein GI	170681708
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2813] 16S RNA G1207 methylase RsmC
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00252655
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGCAT TTACCCCGGC AAGTGAAGTC TTGCTGCGTC ACAGTGATGA TTTCGAACAA 
AGCCGTATTC TGTTTGCCGG AGACTTACAG GATGACCTGC CCGCGCGTTT AGATACCGCG 
GCCAGCCGTG CTCATACCCA GCAATTCCAC CACTGGCAGG TGTTAAGCCG CCAGATGGGG 
GATAACGCCC GTTTTAGTCT GGTCGCCACG GCGAATGATG TCGCAGATTG CGATACGCTG 
ATTTACTACT GGCCGAAGAA CAAACCGGAA GCCCAGTTCC AGTTGATGAA TTTACTTTCT 
CTGCTGCCAG TGGGCACGGA TATTTTTGTC GTTGGCGAGA ACCGCAGCGG CGTGCGCAGC 
GCCGAGCAGA TGCTTGCAGA TTATGCACCG TTGAATAAGG TGGACAGCGC CCGTCGCTGT 
GGCCTCTATT TTGGTCGTCT GGAAAAACAG CCGGTATTTG ATGCCAATAA ATTCTGGGGC 
GAATATAACG TCGATGGCCT GACGGTCAAA ACGCTGCCTG GCGTGTTTAG CCGCGACGGT 
CTGGATGTCG GTAGCCAGTT GCTGCTCTCG ACGTTAACCC CGCACACGAA AGGTAAAGTG 
CTGGATGTCG GCTGTGGCGC GGGCGTACTT TCGGTTGCCT TTGCGCGCCA CTCACCGAAG 
ATTCGTCTCA CGTTGTGCGA TGTTTCTGCG CCAGCAGTTG AAGCCAGCCG TGCAACACTT 
GCGGCCAACG GTATTGAAGG TGAAGTCTTT GCCAGCAACG TCTTTTCTGA GGTGAAAGGT 
CGTTTTGATA TGATCATCTC CAACCCGCCG TTCCACGATG GGATGCAAAC CAGCCTCGAT 
GCGGCGCAAA CGCTGATTCG CGGCGCGGTG CGTCATCTTA ATAGCGGCGG CGAGCTGCGA 
ATTGTAGCGA ACGCCTTCCT GCCTTACCCG GACGTGCTGG ATGAGACATT TGGCTTCCAC 
GAAGTGATCG CGCAAACCGG GCGCTTCAAG GTGTATCGCG CCATTATGAC CCGCCAGGCG 
AAGAAAGGTT GA

Protein sequence

MSAFTPASEV LLRHSDDFEQ SRILFAGDLQ DDLPARLDTA ASRAHTQQFH HWQVLSRQMG 
DNARFSLVAT ANDVADCDTL IYYWPKNKPE AQFQLMNLLS LLPVGTDIFV VGENRSGVRS 
AEQMLADYAP LNKVDSARRC GLYFGRLEKQ PVFDANKFWG EYNVDGLTVK TLPGVFSRDG 
LDVGSQLLLS TLTPHTKGKV LDVGCGAGVL SVAFARHSPK IRLTLCDVSA PAVEASRATL 
AANGIEGEVF ASNVFSEVKG RFDMIISNPP FHDGMQTSLD AAQTLIRGAV RHLNSGGELR 
IVANAFLPYP DVLDETFGFH EVIAQTGRFK VYRAIMTRQA KKG