Gene EcDH1_1637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcDH1_1637
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli DH1
Kingdom	Bacteria
Replicon accession	CP001637
Strand	-
Start bp	1785654
End bp	1786958
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	58%
IMG OID
Product	Histidinol dehydrogenase
Protein accession	ACX39301
Protein GI	260448879
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.140746
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCTTTA ACACAATCAT TGACTGGAAT AGCTGTACTG CGGAGCAACA ACGCCAGCTG 
TTAATGCGCC CGGCGATTTC CGCCTCTGAA AGCATTACCC GCACTGTTAA CGATATTCTC 
GATAACGTGA AAGCACGCGG CGATGAGGCC CTGCGGGAAT ACAGCGCGAA GTTTGATAAA 
ACCACGGTTA CCGCGCTGAA GGTGTCTGCA GAGGAGATCG CCGCCGCCAG CGAACGCCTG 
AGCGACGAGC TAAAACAGGC GATGGCGGTG GCAGTAAAGA ATATTGAAAC CTTCCACACT 
GCGCAAAAAC TGCCGCCGGT AGATGTAGAA ACGCAGCCAG GCGTGCGTTG CCAGCAGGTC 
ACGCGTCCGG TAGCTTCAGT TGGGTTGTAT ATTCCTGGCG GCTCCGCCCC GCTCTTCTCA 
ACGGTATTAA TGCTGGCGAC TCCGGCGAGT ATTGCGGGCT GTAAAAAAGT GGTGCTGTGC 
TCACCGCCGC CGATTGCCGA TGAGATCCTT TATGCGGCGC AGCTGTGCGG TGTGCAGGAC 
GTGTTTAACG TCGGCGGCGC ACAGGCCATT GCCGCACTGG CGTTTGGTAC GGAATCTGTG 
CCAAAAGTGG ACAAAATCTT CGGGCCGGGT AACGCCTTTG TCACCGAAGC GAAACGTCAG 
GTGAGCCAGC GTCTGGACGG TGCGGCGATC GATATGCCCG CAGGCCCGTC GGAAGTGCTG 
GTGATTGCTG ACAGCGGCGC TACGCCGGAT TTCGTGGCTT CTGATTTGCT CTCTCAGGCT 
GAACACGGCC CGGACTCACA GGTGATTTTA CTGACGCCCG CTGCTGATAT GGCGCGTCGC 
GTTGCCGAGG CCGTCGAACG CCAACTGGCA GAACTGCCGC GTGCCGAAAC CGCCCGCCAG 
GCACTGAACG CCAGCCGCCT GATCGTGACT AAAGATTTAG CGCAGTGCGT GGAGATCTCC 
AACCAGTACG GCCCGGAGCA CCTGATCATT CAGACCCGCA ACGCCCGTGA ACTGGTCGAT 
AGCATCACCA GCGCCGGTTC GGTATTTCTT GGTGACTGGT CACCGGAATC GGCAGGTGAT 
TACGCCTCCG GCACCAACCA CGTTCTACCG ACTTACGGTT ACACCGCCAC CTGTTCCAGC 
CTCGGGCTGG CAGATTTCCA GAAGCGCATG ACCGTACAGG AACTGTCGAA AGAGGGGTTC 
TCCGCGCTGG CTTCAACCAT AGAAACACTG GCCGCCGCCG AGCGCCTGAC CGCCCACAAA 
AATGCCGTTA CTTTGCGTGT TAACGCCCTT AAGGAGCAAG CATGA

Protein sequence

MSFNTIIDWN SCTAEQQRQL LMRPAISASE SITRTVNDIL DNVKARGDEA LREYSAKFDK 
TTVTALKVSA EEIAAASERL SDELKQAMAV AVKNIETFHT AQKLPPVDVE TQPGVRCQQV 
TRPVASVGLY IPGGSAPLFS TVLMLATPAS IAGCKKVVLC SPPPIADEIL YAAQLCGVQD 
VFNVGGAQAI AALAFGTESV PKVDKIFGPG NAFVTEAKRQ VSQRLDGAAI DMPAGPSEVL 
VIADSGATPD FVASDLLSQA EHGPDSQVIL LTPAADMARR VAEAVERQLA ELPRAETARQ 
ALNASRLIVT KDLAQCVEIS NQYGPEHLII QTRNARELVD SITSAGSVFL GDWSPESAGD 
YASGTNHVLP TYGYTATCSS LGLADFQKRM TVQELSKEGF SALASTIETL AAAERLTAHK 
NAVTLRVNAL KEQA