Gene EcE24377A_0349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0349
Symbol
ID	5585944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	378965
End bp	380014
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	54%
IMG OID	640924074
Product	zinc-binding dehydrogenase family oxidoreductase
Protein accession	YP_001461502
Protein GI	157155687
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATCA AAGCTGTTGG TGCATATTCC GCTAAACAAC CACTTGAACC GATGGATATC 
ACACGGCGTG AACCGGGACC GAATGATGTC AAAATCGAAA TCGCTTACTG TGGCGTCTGC 
CATTCCGATC TCCACCAGGT CCGTTCCGAG TGGGCGGGGA CGGTTTACCC CTGCGTACCG 
GGTCATGAAA TTGTGGGGCG TGTGGTAGCC GTTGGTGATC AGGTAGAAAA ACATGCGCCG 
GGCGATCTGG TCGGTGTCGG CTGCATTGTC GACAGTTGTA AACATTGCGA AGAGTGTGAA 
GACGGGCTGG AAAACTACTG TGATCACATG ACCGGCACCT ATAACTCGCC GACGCCGGAC 
GAACCGGGCC ATACTCTGGG CGGCTACTCA CAACAGATCG TCGTTCATGA GCGATATGTT 
CTGCGTATTC GTCACCCGCA AGAGCAGCTG GCGGCGGTGG CTCCTTTGTT GTGTGCAGGG 
ATCACCACGT ATTCGCCGCT ACGTCACTGG CAGGCCGGGC CGGGTAAAAA AGTGGGCGTG 
GTCGGCATCG GCGGTCTGGG ACATATGGGG ATCAAGCTGG CCCACGCGAT GGGGGCGCAT 
GTGGTGGCAT TTACCACTTC TGAGGCAAAA CGCGAAGCGG CAAAAGCCCT GGGGGCCGAT 
GAAGTTGTTA ACTCACGCAA TGCCGATGAG ATGGCGGCTC ATCTGAAGAG TTTCGATTTC 
ATTTTGAATA CAGTAGCTGC GCCACATAAT CTCGACGATT TTACCACCTT GCTGAAGCGT 
GATGGCACCA TGACGCTGGT TGGTGCGCCT GCGACACCGC ATAAATCGCC GGAAGTTTTC 
AACCTGATCA TGAAACGCCG TGCGATAGCC GGTTCTATGA TTGGCGGCAT TCCAGAAACT 
CAGGAGATGC TCGATTTTTG CGCCGAACAT GGCATCGTGG CTGATATAGA GATGATTCGG 
GCCGATCAAA TTAATGAAGC CTATGAGCGA ATGCTGCGTG GTGATGTGAA ATATCGTTTT 
GTTATCGATA ATCGCACACT AACAGACTGA

Protein sequence

MKIKAVGAYS AKQPLEPMDI TRREPGPNDV KIEIAYCGVC HSDLHQVRSE WAGTVYPCVP 
GHEIVGRVVA VGDQVEKHAP GDLVGVGCIV DSCKHCEECE DGLENYCDHM TGTYNSPTPD 
EPGHTLGGYS QQIVVHERYV LRIRHPQEQL AAVAPLLCAG ITTYSPLRHW QAGPGKKVGV 
VGIGGLGHMG IKLAHAMGAH VVAFTTSEAK REAAKALGAD EVVNSRNADE MAAHLKSFDF 
ILNTVAAPHN LDDFTTLLKR DGTMTLVGAP ATPHKSPEVF NLIMKRRAIA GSMIGGIPET 
QEMLDFCAEH GIVADIEMIR ADQINEAYER MLRGDVKYRF VIDNRTLTD