Gene ECH74115_0080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0080
Symbol	leuB
ID	6968264
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	85455
End bp	86546
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	55%
IMG OID	643384158
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_002268681
Protein GI	209399607
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGAAGA ATTACCATAT TGCCGTATTG CCGGGGGATG GCATTGGTCC GGAAGTGATG 
ACCCAGGCGC TGAAAGTGCT GGATGCCGTG CGCAACCGCT TTGCGATGCG CATCACTACC 
AGCCATTACG ATGTAGGCGG CGCAGCCATT GATAACCACG GGCAACCACT GCCGCCTGCG 
ACGGTTGAAG GTTGTGAGCA AGCCGATGCC GTGCTGTTTG GCTCGGTAGG CGGCCCGAAA 
TGGGAACATT TACCACCGGA CCAGCAACCA GAACGCGGCG CGCTGTTGCC TTTGCGTAAG 
CACTTCAAAT TATTCAGCAA CCTGCGTCCG GCAAAACTGT ATCAGGGGCT GGAAGCATTC 
TGTCCGCTGC GTGCAGACAT TGCCGCAAAC GGCTTCGACA TCCTGTGCGT GCGCGAACTG 
ACCGGCGGCA TCTATTTCGG TCAGCCAAAA GGCCGCGAAG GTAGCGGACA ATATGAAAAA 
GCGTTTGATA CCGAGGTGTA TCACCGTTTT GAGATCGAGC GTATTGCCCG CATCGCGTTT 
GAATCTGCTC GTAAACGTCG CCATAAAGTG ACGTCGATCG ATAAAGCCAA CGTGCTGCAA 
TCCTCTATTT TATGGCGTGA AATCGTCAAC GAGATCGCCA CGGAATACCC GGATATCGAA 
CTGGCGCATA TGTACATCGA CAACGCCACC ATGCAGCTGA TTAAAGATCC ATCACAGTTT 
GACGTTCTGC TGTGCTCCAA CCTGTTTGGC GACATTCTGT CTGACGAGTG CGCAATGATC 
ACTGGCTCGA TGGGGATGTT GCCTTCCGCC AGCCTGAACG AGCAAGGTTT TGGACTGTAT 
GAACCGGCGG GCGGCTCGGC ACCAGATATC GCAGGTAAAA ACATCGCCAA CCCGATTGCG 
CAAATTCTGT CGCTGGCACT GCTGCTGCGT TACAGCCTGG ATGCCGATGA TGCGGCTTCC 
GCCATTGAAC GCGCCATTAA CCGCGCATTA GAAGAAGGCA TTCGCACCGG GGATTTAGCC 
CGTGGCGCTG CCGCCGTTAG TACCGATGAA ATGGGCGATA TCATTGCCCG CTATGTGGCA 
GAAGGGGTGT AA

Protein sequence

MSKNYHIAVL PGDGIGPEVM TQALKVLDAV RNRFAMRITT SHYDVGGAAI DNHGQPLPPA 
TVEGCEQADA VLFGSVGGPK WEHLPPDQQP ERGALLPLRK HFKLFSNLRP AKLYQGLEAF 
CPLRADIAAN GFDILCVREL TGGIYFGQPK GREGSGQYEK AFDTEVYHRF EIERIARIAF 
ESARKRRHKV TSIDKANVLQ SSILWREIVN EIATEYPDIE LAHMYIDNAT MQLIKDPSQF 
DVLLCSNLFG DILSDECAMI TGSMGMLPSA SLNEQGFGLY EPAGGSAPDI AGKNIANPIA 
QILSLALLLR YSLDADDAAS AIERAINRAL EEGIRTGDLA RGAAAVSTDE MGDIIARYVA 
EGV