Gene EcHS_A2950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2950
Symbol
ID	5593787
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	2958352
End bp	2959452
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	52%
IMG OID	640922068
Product	putative RNA 2'-O-ribose methyltransferase
Protein accession	YP_001459578
Protein GI	157162260
COG category	[R] General function prediction only
COG ID	[COG2933] Predicted SAM-dependent methyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0000000000000823622
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAGG TTGTATTGCT GTGCCGTCCG GGCTTTGAAA AAGAGTGCGC CGCAGAAATT 
ACCGATAAAG CCGGCCAGCG GGAAATTTTC GGTTTTGCCC GCGTGAAAGA GAATGCGGGT 
TATGTCATTT ATGAATGTTA TCAACCTGAT GATGGCGATA AGTTAATCCG TGAGCTGCCG 
TTCAGTTCAT TAATTTTTGC CCGCCAGTGG TTTGTGGTGG GGGAACTCCT GCAGCATTTG 
CCGCCAGAAG ATCGTATTAC CCCCATTGTC GGCATGTTAC AGGGCGTAGT AGAGAAGGGC 
GGTGAACTGC GTGTTGAAGT TGCCGATACC AACGAAAGCA AAGAGTTGCT GAAATTCTGC 
CGTAAATTCA CCGTGCCGCT ACGCGCTGCC TTGCGCGATG CCGGGGTGCT GGCGAACTAT 
GAAACGCCGA AGCGTCCGGT AGTGCATGTA TTCTTCATTG CACCAGGCTG CTGCTATACC 
GGTTACTCAT ACAGCAACAA TAATTCGCCG TTCTATATGG GCATTCCGCG CCTGAAATTT 
CCGGCAGATG CGCCGAGTCG TTCTACGCTC AAACTGGAAG AGGCATTTCA TGTGTTTATT 
CCTGCGGATG AGTGGGATGA ACGCCTGGCG AACGGGATGT GGGCGGTGGA TTTGGGCGCT 
TGCCCAGGCG GCTGGACCTA CCAACTGGTG AAGCGCAACA TGTGGGTTTA TTCCGTCGAC 
AACGGCCCGA TGGCGCAAAG TCTGATGGAT ACCGGGCAGG TGACGTGGCT GCGGGAAGAC 
GGGTTTAAAT TCCGTCCGAC ACGCAGCAAT ATCTCCTGGA TGGTATGCGA TATGGTTGAA 
AAACCGGCGA AAGTTGCGGC ATTGATGGCG CAGTGGCTGG TTAATGGCTG GTGCCGTGAA 
ACCATTTTCA ACCTCAAACT GCCGATGAAA AAACGCTACG AAGAAGTGTC ACACAATTTG 
GCGTATATTC AGGCACAGCT TGATGAACAT GGCATAAATG CTCAGATTCA GGCACGGCAG 
TTGTATCACG ATCGCGAAGA AGTGACGGTG CACGTCCGCC GCATCTGGGC TGCGGTGGGT 
GGTCGTCGCG ACGAGCGATA A

Protein sequence

MNKVVLLCRP GFEKECAAEI TDKAGQREIF GFARVKENAG YVIYECYQPD DGDKLIRELP 
FSSLIFARQW FVVGELLQHL PPEDRITPIV GMLQGVVEKG GELRVEVADT NESKELLKFC 
RKFTVPLRAA LRDAGVLANY ETPKRPVVHV FFIAPGCCYT GYSYSNNNSP FYMGIPRLKF 
PADAPSRSTL KLEEAFHVFI PADEWDERLA NGMWAVDLGA CPGGWTYQLV KRNMWVYSVD 
NGPMAQSLMD TGQVTWLRED GFKFRPTRSN ISWMVCDMVE KPAKVAALMA QWLVNGWCRE 
TIFNLKLPMK KRYEEVSHNL AYIQAQLDEH GINAQIQARQ LYHDREEVTV HVRRIWAAVG 
GRRDER