Gene ECH74115_2953 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2953
Symbol	hisD
ID	6967860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	2727997
End bp	2729301
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	57%
IMG OID	643386793
Product	histidinol dehydrogenase
Protein accession	YP_002271261
Protein GI	209397361
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.525891
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.00000000725252
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCTTTA ACACAATCAT TGACTGGAAT AGCTGTACTG CAAAGCAACA ACGCCAGCTG 
TTAATGCGCC CGGCGATCTC CGCTTCTGAA AGCATTACCC GCACTGTTAA CGATATTCTC 
GATAGCGTGA AAGCACGCGG TGATGACGCC CTGCGGGAAT ATAGCGCGAA GTTTGATAAA 
ACCACGGTTA CCGCACTGAA GGTGTCTGCT GAGGAAATTG CCGCCGCCAG CGAACGCCTG 
AGCGACGAGC TAAAACAGGC GATGGCGGTG GCAGTAAAGA ATATTGAAAC CTTCCACACT 
GCGCAAAAAC TGCCGCCGGT AGATGTAGAA ACGCAGCCAG GCGTGCGTTG CCAGCAAGTC 
ACGCGCCCGG TAGCTTCAGT TGGGTTGTAT ATTCCTGGCG GCTCCGCCCC GCTCTTCTCA 
ACGGTATTAA TGCTGGCAAC TCCGGCGCGT ATTGCGGGCT GTAAAAAAGT GGTGTTGTGC 
TCACCGCCGC CGATTGCCGA TGAGATCCTT TATGCGGCGC AGCTGTGCGG TGTGCAGGAC 
GTGTTTAACG TCGGCGGCGC ACAGGCCATT GCCGCGCTGG CGTTTGGTAC GGAATCTGTG 
CCGAAAGTGG ACAAAATCTT CGGGCCGGGT AACGCCTTTG TCACCGAGGC AAAACGTCAG 
GTGAGCCAGC GTCTGGACGG TGCGGCGATC GATATGCCCG CAGGCCCGTC GGAAGTGTTG 
GTCATTGCCG ACAGCGGCGC AACGCCGGAT TTCGTGGCTT CTGATTTGCT TTCTCAGGCT 
GAACACGGCC CGGACTCACA GGTGATTTTA CTGACGCCTG ACGCTGATAT GGCGCATCAA 
GTTGCCGAAG CCGTCGAACG CCAGTTAGCA GAACTGCCGC GTGCCGAAAC CGCCCGCCAG 
GCACTGAACG CCAGCCGCCT GATCGTGACT AAAGATTTAG CGCAGTGCGT GGAGATCTCC 
AACCAGTACG GCCCGGAGCA CCTGATCATT CAGACCCGCA ACGCCCGCGA ACTGGTCGAT 
GGCATCACCA GCGCCGGTTC GGTATTTCTT GGTGACTGGT CACCGGAATC GGCAGGTGAT 
TACGCCTCCG GAACCAACCA TGTTCTACCG ACTTACGGCT ACACCGCCAC CTGTTCCAGC 
CTCGGACTGG CGGATTTCCA GAAGCGGATG ACCGTGCAGG AACTGTCGAA AGTAGGTTTC 
TCCGCGCTGG CTTCGACCAT TGAAACACTG GCCGCCGCCG AGCGCCTGAC CGCCCACAAA 
AATGCCGTTA CTTTGCGTGT TAACGCCCTT AAGGAGCAAG CATGA

Protein sequence

MSFNTIIDWN SCTAKQQRQL LMRPAISASE SITRTVNDIL DSVKARGDDA LREYSAKFDK 
TTVTALKVSA EEIAAASERL SDELKQAMAV AVKNIETFHT AQKLPPVDVE TQPGVRCQQV 
TRPVASVGLY IPGGSAPLFS TVLMLATPAR IAGCKKVVLC SPPPIADEIL YAAQLCGVQD 
VFNVGGAQAI AALAFGTESV PKVDKIFGPG NAFVTEAKRQ VSQRLDGAAI DMPAGPSEVL 
VIADSGATPD FVASDLLSQA EHGPDSQVIL LTPDADMAHQ VAEAVERQLA ELPRAETARQ 
ALNASRLIVT KDLAQCVEIS NQYGPEHLII QTRNARELVD GITSAGSVFL GDWSPESAGD 
YASGTNHVLP TYGYTATCSS LGLADFQKRM TVQELSKVGF SALASTIETL AAAERLTAHK 
NAVTLRVNAL KEQA