Gene EcHS_A1535 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1535
Symbol
ID	5592299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1539997
End bp	1541034
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	53%
IMG OID	640920690
Product	zinc-binding dehydrogenase family oxidoreductase
Protein accession	YP_001458246
Protein GI	157160928
COG category	[R] General function prediction only
COG ID	[COG2130] Putative NADP-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	59
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGCAAC AAAAGCAGCG TAATCGACGT TGGGTTCTGG CCTCGCGTCC ACATGGCGCA 
CCGGTTCCGG AGAATTTCCG TCTTGAAGAA GATGATGTCG CCACACCGGG TGAAGGACAG 
GTGTTACTGC GCACAGTTTA TTTGTCCCTG GACCCGTATA TGCGTGGACG TATGAGCGAT 
GAGCCATCTT ATTCACCGCC TGTTGATATT GGCGGCGTGA TGGTCGGCGG CACGGTGAGC 
CGTGTTGTGG AGTCGAATCA TCCTGATTAT CAGCCTGGCG ACTGGGTGCT GGGCTACAGT 
GGATGGCAGG ACTATGACAT ATCCAGTGGT GATGATCTGG TGAAACTTGG CGATCATCCG 
CAAAATCCAT CGTGGTCGCT GGGTGTGCTG GGGATGCCAG GCTTTACCGC TTATATGGGG 
CTGCTGGATA TCGGTCAGCC TAAAGAGGGC GAAACGTTGG TGGTAGCTGC GGCGACAGGT 
CCTGTGGGAG CAACGGTGGG GCAAATCGGC AAACTTAAAG GTTGCAGGGT GGTGGGGGTT 
GCCGGTGGCG CGGAAAAATG CCGCCATGCT ATCGAGGTGC TGGGCTTCGA TGTTTGTCTT 
GATCACCACG CGGATGATTT TGCCGAACAA CTGGCGAAAG CGTGCCCAAA AGGTATTGAT 
ATCTATTATG AAAACGTGGG CGGTAAGGTA TTTGATGCAG TGCTACCATT ACTTAATACA 
TCTGCGCGCA TTCCCGTTTG TGGCTTAGTG AGCAGCTATA ACGCTACAGA GCTACCACCC 
GGTCCGGATC GTTTACCCCT GTTGATGGCA ACGGTGCTGA AAAAACGTAT TCGCTTGCAA 
GGGTTTATTA TCGCTCAGGA TTATGGTCAC CGCATCCATG AGTTTCAGAA GGAGATGGGG 
CAATGGGTGA AAGAGGATAA AATCCACTAC CGCGAAGATA TTACTGATGG TTTAGAGAAT 
GCGCCACAGA CGTTTATCGG CCTGCTGAAG GGTAAAAACT TCGGCAAAGT GGTGATCCGC 
GTGGCGGGTG ATGATTAA

Protein sequence

MGQQKQRNRR WVLASRPHGA PVPENFRLEE DDVATPGEGQ VLLRTVYLSL DPYMRGRMSD 
EPSYSPPVDI GGVMVGGTVS RVVESNHPDY QPGDWVLGYS GWQDYDISSG DDLVKLGDHP 
QNPSWSLGVL GMPGFTAYMG LLDIGQPKEG ETLVVAAATG PVGATVGQIG KLKGCRVVGV 
AGGAEKCRHA IEVLGFDVCL DHHADDFAEQ LAKACPKGID IYYENVGGKV FDAVLPLLNT 
SARIPVCGLV SSYNATELPP GPDRLPLLMA TVLKKRIRLQ GFIIAQDYGH RIHEFQKEMG 
QWVKEDKIHY REDITDGLEN APQTFIGLLK GKNFGKVVIR VAGDD