Gene EcHS_A0862 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0862
Symbol
ID	5595281
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	868855
End bp	869862
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	54%
IMG OID	640920034
Product	putative SAM-dependent methyltransferase
Protein accession	YP_001457601
Protein GI	157160283
COG category	[R] General function prediction only
COG ID	[COG3129] Predicted SAM-dependent methyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	0.0721941
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGGGAATG ATAAACGCAG CCAGATATTT ACCCTGTCGC GTTATGCGGG TATCTTACGC 
CGCTGCTTAA AGGAGAATGC TATGTCCGCC CAGAAACCGG GGTTGCATCC GCGCAACCGT 
CATCACAGCC GCTACGATCT CGCCACGCTT TGTCAGGTCA ATCCTGAACT CAGGCAATTC 
CTCACGCTTA CACCCGCCGG GGAGCAAAGC GTAGACTTTG CCAATCCGCT GGCGGTGAAG 
GCGCTCAATA AGGCGTTGCT GGCCCATTTT TACGCCGTAG CGAACTGGGA TATCCCCGAC 
GGTTTTCTCT GCCCACCAGT ACCGGGCCGG GCGGATTATA TTCATCACCT TGCCGATTTA 
CTGGCAGAAG CAAGCGGAAC AATTCCAGCG AATGCCAGCA TTCTGGATAT CGGCGTTGGT 
GCGAACTGTA TTTATCCGCT GATTGGCGTA CATGAATATG GCTGGCGTTT TACCGGTAGT 
GAAACCAGCA GCCAGGCGTT AAGCAGTGCG CAGGCGATTA TCAGTTCTAA TCCGGGGCTT 
AACCGCGCCA TTCGTCTGCG TCGGCAAAAA GAGAGTGGGG CGATTTTTAA CGGCATCATC 
CATAAAAACG AGCAATACGA CGCGACCTTG TGTAACCCGC CATTCCACGA TTCCGCCGCT 
GCGGCACGGG CAGGTAGTGA GCGTAAACGC CGTAACCTGG GGCTGAACAA AGACGATGCA 
CTGAACTTTG GCGGCCAGCA ACAGGAGTTG TGGTGTGAAG GCGGTGAAGT CACCTTTATC 
AAAAAGATGA TTGAAGAGAG CAAAGGCTTC GCGAAGCAGG TGATGTGGTT TACATCACTG 
GTATCTCGTG GTGAAAACTT ACCGCCGTTG TATCGTGCCC TGACGGACGT GGGCGCGGTG 
AAGGTGGTTA AAAAAGAGAT GGCCCAGGGG CAAAAGCAGA GTCGCTTTAT TGCCTGGACC 
TTTATGAACG ACGAGCAGCG CCGCCGTTTT GTCAATCGCC AGCGTTAA

Protein sequence

MGNDKRSQIF TLSRYAGILR RCLKENAMSA QKPGLHPRNR HHSRYDLATL CQVNPELRQF 
LTLTPAGEQS VDFANPLAVK ALNKALLAHF YAVANWDIPD GFLCPPVPGR ADYIHHLADL 
LAEASGTIPA NASILDIGVG ANCIYPLIGV HEYGWRFTGS ETSSQALSSA QAIISSNPGL 
NRAIRLRRQK ESGAIFNGII HKNEQYDATL CNPPFHDSAA AARAGSERKR RNLGLNKDDA 
LNFGGQQQEL WCEGGEVTFI KKMIEESKGF AKQVMWFTSL VSRGENLPPL YRALTDVGAV 
KVVKKEMAQG QKQSRFIAWT FMNDEQRRRF VNRQR