Gene EcSMS35_3376 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3376
Symbol
ID	6143975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3459537
End bp	3460673
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	54%
IMG OID	641618205
Product	methyltransferase family protein
Protein accession	YP_001745354
Protein GI	170684079
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2813] 16S RNA G1207 methylase RsmC
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCACT TAGACAACGG TTTCCGTTCA CTGACACTAC AACGTTTTCC GGCGACGGAT 
GACGTTAACC CGCTACAGGC GTGGGAAGCG GCGGATGAAT ATTTGCTGCA ACAGTTGGAC 
GACACAGAAA TCCGCGGCCC GGTGTTGATC CTGAATGATG CCTTTGGTGC GTTAAGTTGT 
GCGCTGGCGG AACATAAGCC GTACAGCATT GGCGACTCAT ACATCAGTGA ACTGGCCACG 
CGCGAGAATT TACGCCTCAA CGGGATTGAT GAATCGAGCG TGAAGTTTCT CGACAGCACC 
GCCGACTACC CGCAACAGCC GGGCGTGGTA CTGATCAAAG TACCGAAAAC ACTGGCGTTG 
CTGGAACAAC AACTGCGTGC GCTGCGCAAA GTGGTCACGC CGGATACACG TATTATTGCC 
GGTGCTAAAG CCCGTGACAT TCACACCTCC ACGCTGGAAC TGTTCGAAAA AGTGCTCGGT 
CCGACCACCA CCACACTGGC ATGGAAGAAA GCGCGCCTGA TTAACTGCAC TTTCAACGAG 
CCGCCGCTGG TTGATGCACC GCAGACCGTT AGCTGGAAGC TGGAAGGTAC TGACTGGACT 
ATCCACAACC ATGCGAATGT CTTCTCCCGC ACCGGGCTGG ATATTGGCGC GCGCTTCTTT 
ATGCAGCATC TGCCAGAGAA TCTCGAAGGT GAGATTGTCG ATCTCGGTTG TGGTAATGGC 
GTTATTGGTC TGACGCTGCT TGATAAAAAC CCGCAGGCGA AAGTGGTGTT TGTCGATGAA 
TCGCCGATGG CGGTTGCTTC CAGCCGTTTG AACGTTGAAA CCAACATGCC AGAGGCGTTG 
GATCGCTGCG AGTTTATGAT TAACAACGCG CTCTCCGGCG TGGAGCCTTT CCGCTTTAAT 
GCTGTGCTCT GCAACCCGCC GTTTCATCAG CAACATGCGC TGACCGATAA CGTCGCCTGG 
GAGATGTTCC ACCACGCCCG CCGCTGTCTG AAAATCAACG GCGAGCTGTA TATCGTTGCC 
AACCGTCACC TGGATTACTT CCACAAACTG AAGAAAATTT TCGGCAACTG CACCACCATC 
GCCACGAATA ATAAATTTGT GGTGCTGAAA GCAGTGAAGC TGGGGCGTCG TCGGTAA

Protein sequence

MSHLDNGFRS LTLQRFPATD DVNPLQAWEA ADEYLLQQLD DTEIRGPVLI LNDAFGALSC 
ALAEHKPYSI GDSYISELAT RENLRLNGID ESSVKFLDST ADYPQQPGVV LIKVPKTLAL 
LEQQLRALRK VVTPDTRIIA GAKARDIHTS TLELFEKVLG PTTTTLAWKK ARLINCTFNE 
PPLVDAPQTV SWKLEGTDWT IHNHANVFSR TGLDIGARFF MQHLPENLEG EIVDLGCGNG 
VIGLTLLDKN PQAKVVFVDE SPMAVASSRL NVETNMPEAL DRCEFMINNA LSGVEPFRFN 
AVLCNPPFHQ QHALTDNVAW EMFHHARRCL KINGELYIVA NRHLDYFHKL KKIFGNCTTI 
ATNNKFVVLK AVKLGRRR