Gene EcHS_A1855 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1855
Symbol
ID	5590887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1873074
End bp	1874054
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	48%
IMG OID	640920999
Product	aldo/keto reductase family oxidoreductase
Protein accession	YP_001458551
Protein GI	157161233
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	0.0511443
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGA TACCTTTAGG CACAACGGAT ATTACGCTTT CGCGAATGGG GTTGGGGACA 
TGGGCCATTG GCGGCGGTCC TGCATGGAAT GGCGATCTCG ATCGGCAAAT ATGTATTGAT 
ACGATTCTTG AAGCCCATCG TTGCGGCATT AATCTGATTG ATACTGCACC AGGATATAAC 
TTTGGCAATA GTGAAGTTAT CGTCGGTCAG GCGTTAAAAA AACTGCCCCG TGAACAGGTT 
GTAGTAGAAA CCAAATGCGG CATTGTCTGG GAACGAAAAG GAAGTTTATT CAACAAAGTT 
GGCGATCGGC AGTTGTATAA AAACCTTTCC CCGGAATCTA TCCGCGAAGA GGTAGAAGCC 
AGCTTGCAAC GTCTGGGTAT TGATTACATC GATATCTACA TGACGCACTG GCAGTCGGTG 
CCGCCATTTT ATACGCCGAT CGCTGAAACT GTCGCAGTGC TTAATGAGTT AAAGGCTGAA 
GGGAAAATTC GCGCGATAGG CGCTGCTAAC GTCGATGCTG ACCATATCCG CGAGTATCTG 
CAATATGGTG AACTGGATAT TATTCAGGCG AAATACAGTA TCCTCGACCG GGCAATGGAA 
AACGAACTGC TGCCGCTATG TCGTGATAAT GGCATTGTGG TTCAGGTTTA TTCCCCGCTA 
GAGCAGGGAT TGTTGACCGG CACCATCACT CGTGATTACG TTCCGGGTGG CGCTCGGGCA 
AATAAAGTCT GGTTCCAGCG TGAAAACATG CTGAAAGTGA TTGATATGCT TGAACAGTGG 
CAGCCACTTT GTGCTCGTTA TCAGTGCACA ATTCCCACTC TGGCACTGGC GTGGATATTA 
AAACAGAGTG ATTTAATCTC CATTCTTAGT GGGGCTACTG CACCGGAACA GGTACGCGAA 
AATGTCGCGG CACTGATTAT CAACTTATCG GATGCAGACG CAACATTGAT GAGGGAAATG 
GCAGAGGCCC TGGAGCGTTA A

Protein sequence

MKKIPLGTTD ITLSRMGLGT WAIGGGPAWN GDLDRQICID TILEAHRCGI NLIDTAPGYN 
FGNSEVIVGQ ALKKLPREQV VVETKCGIVW ERKGSLFNKV GDRQLYKNLS PESIREEVEA 
SLQRLGIDYI DIYMTHWQSV PPFYTPIAET VAVLNELKAE GKIRAIGAAN VDADHIREYL 
QYGELDIIQA KYSILDRAME NELLPLCRDN GIVVQVYSPL EQGLLTGTIT RDYVPGGARA 
NKVWFQRENM LKVIDMLEQW QPLCARYQCT IPTLALAWIL KQSDLISILS GATAPEQVRE 
NVAALIINLS DADATLMREM AEALER