Gene ECH74115_0079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0079
Symbol	leuC
ID	6968726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	84052
End bp	85452
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	56%
IMG OID	643384157
Product	isopropylmalate isomerase large subunit
Protein accession	YP_002268680
Protein GI	209397303
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAAGA CGTTATACGA AAAATTATTC GACGCTCACG TAGTGTACGA AGCCGAAAAT 
GAAACCCCGC TGTTATATAT CGACCGCCAC CTGGTGCATG AAGTGACCTC ACCGCAGGCG 
TTCGATGGTC TGCGCGCCCA CGGTCGCCCG GTACGTCAGC CGGGCAAAAC CTTCGCCACC 
ATGGATCACA ACGTCTCTAC CCAGACTAAA GACATTAATG CCTGCGGTGA AATGGCGCGC 
ATCCAGATGC AGGAGCTGAT CAAAAACTGC AAAGAATTTG GCGTCGAACT GTATGACCTG 
AATCACCCCT ATCAAGGGAT CGTCCACGTA ATGGGGCCGG AACAGGGCGT GACCTTGCCG 
GGGATGACCA TTGTCTGCGG CGACTCGCAT ACCGCCACCC ACGGCGCGTT TGGCGCACTG 
GCCTTTGGTA TCGGCACTTC CGAAGTTGAA CACGTACTGG CAACGCAAAC CCTGAAACAG 
GGCCGTGCGA AGACCATGAA AATTGAAGTC CAGGGCAAAG CCGCGCCGGG CATTACCGCA 
AAAGATATCG TGTTGGCAAT TATCGGTAAA ACCGGTAGCG CAGGCGGCAC CGGGCATGTG 
GTGGAGTTTT GCGGCGAAGC AATCCGTGAT TTAAGCATGG AAGGTCGGAT GACCCTGTGC 
AATATGGCAA TCGAAATGGG CGCGAAAGCC GGTCTGGTTG CACCTGACGA AACCACCTTT 
AACTATGTCA AAGGCCGTCT GCATGCGCCG AAAGGCAAAG ATTTCGACGA CGCCGTTGCC 
TACTGGAAAA CCCTGCAAAC CGACGAAGGC GCAACTTTCG ATACCGTTGT CACTTTGCAG 
GCAGAAGAGA TTTCACCGCA GGTCACCTGG GGAACTAACC CAGGCCAGGT GATTTCCGTG 
AACGACAATA TTCCCGATCC GGCTTCGTTT GCCGATCCGG TTGAACGCGC GTCGGCAGAA 
AAAGCGTTGG CCTATATGGG GCTGAAACCG GGTATTCTGC TGACCGAAGT GGCTATCGAC 
AAAGTGTTTA TCGGTTCCTG CACCAACTCA CGTATTGAAG ATTTACGCGC GGCGGCGGAA 
ATCGCCAAAG GGCGGAAAGT CGCGCCAGGC GTACAGGCGC TGGTGGTTCC CGGCTCTGGT 
CCGGTAAAAG CGCAGGCGGA AGCAGAAGGT CTGGATAAAA TCTTTATTGA AGCCGGTTTT 
GAATGGCGCT TGCCTGGCTG CTCAATGTGT CTGGCGATGA ACAACGACCG TCTGAATCCG 
GGCGAACGTT GTGCCTCCAC CAGCAACCGT AACTTTGAAG GCCGTCAGGG GCGCGGCGGG 
CGCACGCATC TGGTCAGCCC GGCAATGGCT GCCGCCGCGG CTGTGACCGG CCATTTCGCC 
GACATTCGCA ACATTAAATA A

Protein sequence

MAKTLYEKLF DAHVVYEAEN ETPLLYIDRH LVHEVTSPQA FDGLRAHGRP VRQPGKTFAT 
MDHNVSTQTK DINACGEMAR IQMQELIKNC KEFGVELYDL NHPYQGIVHV MGPEQGVTLP 
GMTIVCGDSH TATHGAFGAL AFGIGTSEVE HVLATQTLKQ GRAKTMKIEV QGKAAPGITA 
KDIVLAIIGK TGSAGGTGHV VEFCGEAIRD LSMEGRMTLC NMAIEMGAKA GLVAPDETTF 
NYVKGRLHAP KGKDFDDAVA YWKTLQTDEG ATFDTVVTLQ AEEISPQVTW GTNPGQVISV 
NDNIPDPASF ADPVERASAE KALAYMGLKP GILLTEVAID KVFIGSCTNS RIEDLRAAAE 
IAKGRKVAPG VQALVVPGSG PVKAQAEAEG LDKIFIEAGF EWRLPGCSMC LAMNNDRLNP 
GERCASTSNR NFEGRQGRGG RTHLVSPAMA AAAAVTGHFA DIRNIK