Gene EcolC_3686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3686
Symbol	rsmC
ID	6067053
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4035275
End bp	4036306
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	56%
IMG OID	641603101
Product	16S ribosomal RNA m2G1207 methyltransferase
Protein accession	YP_001726624
Protein GI	170021670
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2813] 16S RNA G1207 methylase RsmC
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.217552
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.00016948
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTGCAT TTACCCCGGC AAGTGAAGTC TTGCTGCGTC ACAGTGATGA TTTCGAACAA 
AGCCGTATTC TGTTTGCCGG AGACTTACAG GATGACCTGC CCGCGCGTTT AGATACCGCG 
GCCAGCCGTG CTCATACCCA GCAATTCCAC CACTGGCAGG TATTAAGCCG CCAGATGGGG 
GATAACGCCC GTTTCAGTCT GGTCGCCACG GCGGATGACG TCGCAGATTG CGATACGCTG 
ATTTACTACT GGCCGAAGAA CAAACCGGAA GCCCAGTTCC AGTTGATGAA TTTACTTTCT 
CTGCTGCCAG TGGGGACAGA TATTTTTGTC GTTGGCGAGA ACCGCAGCGG CGTGCGCAGC 
GCCGAGCAGA TGCTGGCAGA TTATGCGCCG TTGAATAAAG TCGACAGCGC TCGTCGCTGT 
GGCCTCTATT TTGGTCGTCT GGAAAAACAG CCGGTATTTG ATGCCGATAA ATTCTGGGGC 
GAATACAGCG TCGATGGCCT GACGGTCAAA ACGCTGCCTG GCGTGTTTAG CCGCGACGGT 
CTGGATGTCG GTAGCCAGTT GCTGCTCTCG ACGTTAACCC CGCACACGAA AGGTAAAGTG 
CTGGATGTCG GCTGTGGCGC GGGTGTGCTT TCAGTTGCCT TTGCGCGCCA TTCGCCGAAA 
ATTCGTCTCA CCTTGTGCGA TGTCTCTGCG CCAGCGGTAG AAGCCAGCCG CGCAACACTT 
GCGGCCAACG GTGTTGAAGG TGAAGTCTTT GCCAGCAACG TCTTTTCCGA GGTGAAAGGT 
CGTTTTGATA TGATCATCTC CAACCCGCCG TTCCACGATG GGATGCAAAC CAGCCTGGAT 
GCGGCGCAAA CGCTGATTCG CGGCGCGGTG CGTCATCTTA ATAGCGGCGG CGAGCTGCGA 
ATTGTAGCGA ACGCCTTCCT GCCTTACCCG GACGTGCTGG ATGAGACATT TGGCTTCCAT 
GAAGTGATTG CGCAAACCGG GCGTTTCAAG GTGTATCGCG CCATTATGAC CCGCCAGGCG 
AAGAAAGGTT AA

Protein sequence

MSAFTPASEV LLRHSDDFEQ SRILFAGDLQ DDLPARLDTA ASRAHTQQFH HWQVLSRQMG 
DNARFSLVAT ADDVADCDTL IYYWPKNKPE AQFQLMNLLS LLPVGTDIFV VGENRSGVRS 
AEQMLADYAP LNKVDSARRC GLYFGRLEKQ PVFDADKFWG EYSVDGLTVK TLPGVFSRDG 
LDVGSQLLLS TLTPHTKGKV LDVGCGAGVL SVAFARHSPK IRLTLCDVSA PAVEASRATL 
AANGVEGEVF ASNVFSEVKG RFDMIISNPP FHDGMQTSLD AAQTLIRGAV RHLNSGGELR 
IVANAFLPYP DVLDETFGFH EVIAQTGRFK VYRAIMTRQA KKG