Gene EcHS_A0490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0490
Symbol
ID	5593090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	500953
End bp	501927
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	54%
IMG OID	640919673
Product	aldo/keto reductase family oxidoreductase
Protein accession	YP_001457258
Protein GI	157159940
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	72
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATACA ACCCCTTAGG AAAAACCGAC CTTCGCGTTT CCCGACTTTG CCTCGGCTGT 
ATGACCTTTG GCGAGCCAGA TCGTGGTAAT CACGCATGGA CACTGCCGGA AGAGAGTAGC 
CGTCCCATCA TTAAACGCGC GCTGGAAGGC GGCATAAATT TCTTTGATAC CGCCAATAGC 
TATTCCGATG GCAGCAGCGA AGAGATCGTT GGTCGCGCAC TGCGGGATTT CGCCCGTCGT 
GAAGACGTGG TCGTTGCGAC GAAAGTGTTC CATCGCGTTG GTGATTTACC GGAAGGATTA 
TCCCGTGCAC AAATTTTGCG CTCTATCGAC GACAGCCTGC GCCGTCTCGG CATGGATTAT 
GTCGATATCC TGCAAATTCA TCGCTGGGAT TACAACACGC CGATCGAAGA GACGCTGGAA 
GCCCTGAACG ACGTGGTAAA AGCCGGGAAA GCGCGTTATA TCGGCGCGTC ATCCATGCAC 
GCTTCGCAGT TTGCTCAGGC CCTGAAGCTA CAAAAACAGC ACGGCTGGGC GCAGTTTATC 
AGTATGCAGG ATCACTACAA TCTGATTTAT CGCGAAGAAG AGCGCGAGAT GCTGCCTCTG 
TGTTATCAGG AGGGCGTGGC GGTGATTCCG TGGAGCCCGC TGGCGCGGGG GCGACTGACG 
CGTCCGTGGG GAGAAACTAC CGCACGACTG GTGTCTGATG AGGTGGGGAG AAATCTCTAT 
AAAGAAAGCG ATGAAAATGA CGCGCAGATC GCAGAGCGGT TAACGGGCGT CAGTGAAGAA 
CTCGGTGCAA CACGAGCACA AGTTGCGCTG GCCTGGTTGT TGAGTAAACC GGGCATTGCC 
GCACCGATTA TCGGTACATC GCGGGAAGAA CAGCTTGATG AGCTGCTGAA CGCGGTGGAT 
ATCACTTTGA AGCCAGAACA GATTGCCGAA CTGGAAACGC CGTATAAACC GCATGCGGTC 
GTAGGATTTA AATAA

Protein sequence

MQYNPLGKTD LRVSRLCLGC MTFGEPDRGN HAWTLPEESS RPIIKRALEG GINFFDTANS 
YSDGSSEEIV GRALRDFARR EDVVVATKVF HRVGDLPEGL SRAQILRSID DSLRRLGMDY 
VDILQIHRWD YNTPIEETLE ALNDVVKAGK ARYIGASSMH ASQFAQALKL QKQHGWAQFI 
SMQDHYNLIY REEEREMLPL CYQEGVAVIP WSPLARGRLT RPWGETTARL VSDEVGRNLY 
KESDENDAQI AERLTGVSEE LGATRAQVAL AWLLSKPGIA APIIGTSREE QLDELLNAVD 
ITLKPEQIAE LETPYKPHAV VGFK