Gene EcE24377A_0075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_0075
Symbol	leuC
ID	5587213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	81154
End bp	82554
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	55%
IMG OID	640923806
Product	isopropylmalate isomerase large subunit
Protein accession	YP_001461243
Protein GI	157157583
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTAAAA CGTTATACGA AAAATTATTC GACGCTCACG TAGTGTACGA AGCCGAAAAC 
GAAACCCCGC TGTTATATAT CGACCGCCAC CTGGTGCATG AAGTGACCTC ACCGCAGGCG 
TTTGATGGTC TGCGCGCCCA CGGTCGCCCG GTACGTCAGC CGGGCAAAAC CTTCGCCACT 
ATGGATCACA ACGTCTCTAC CCAGACCAAA GACATTAATG CCTGTGGTGA AATGGCGCGC 
ATCCAGATGC AGGAGCTGAT TAAAAACTGC AAAGAATTTG GCGTCGAGCT GTATGACCTG 
AATCACCCGT ATCAGGGGAT CGTCCACGTA ATGGGGCCGG AACAGGGCGT CACCTTGCCG 
GGGATGACCA TTGTCTGCGG CGACTCGCAT ACCGCCACCC ACGGCGCGTT TGGCGCACTG 
GCCTTTGGTA TCGGCACTTC CGAAGTTGAA CACGTACTGG CAACACAAAC CCTGAAACAG 
GGCCGTGCGA AGACCATGAA AATTGAAGTC CAGGGCAAAG CCGCGCCGGG CATTACAGCA 
AAAGATATCG TGCTGGCAAT TATCGGTAAA ACTGGCAGCG CAGGCGGCAC CGGGCATGTG 
GTGGAGTTTT GCGGCGAAGC AATTCGTGAT TTAAGCATGG AAGGTCGTAT GACCCTGTGC 
AATATGGCAA TCGAAATGGG CGCAAAAGCC GGTCTGGTTG CACCGGACGA AACCACCTTT 
AACTATGTCA AAGGCCGTTT GCATGCGCCG AAAGGCAAAG ATTTCGACGA CGCCGTTGCC 
TACTGGAAAA CCCTGCAAAC CGACGAAGGC GCAACTTTCG ATACCGTTGT CACTCTGCAA 
GCAGAAGAAA TTTCACCGCA GGTCACCTGG GGCACCAATC TAGGCCAGGT GATTTCCGTG 
AACGACAATA TTCCCGATCC GGCTTCGTTT GCCGATCCGG TTGAACGCGC GTCGGCAGAA 
AAAGCGCTGG CCTATATGGG GCTGAAACCG GGCATTCCGC TGACCGAAGT GGCTATCGAC 
AAAGTGTTTA TCGGTTCCTG TACCAACTCG CGCATTGAAG ATTTACGCGC GGCAGCGGAG 
ATCGCCAAAG GGCGAAAAGT CGCGCCAGGC GTGCAGGCAC TGGTGGTTCC CGGCTCTGGC 
CCGGTAAAAG CCCAGGCGGA AGCGGAAGGT CTGGATAAAA TCTTTATTGA AGCCGGTTTT 
GAATGGCGCT TGCCTGGCTG CTCAATGTGT CTGGCGATGA ACAACGACCG TCTGAATCCG 
GGCGAACGTT GTGCATCCAC CAGCAACCGT AACTTTGAAG GCCGCCAGGG GCGCGGCGGG 
CGCACGCATC TGGTCAGCCC GGCAATGGCT GCCGCTGCTG CTGTGACCGG ACATTTCGCC 
GACATTCGCA ACATTAAATA A

Protein sequence

MAKTLYEKLF DAHVVYEAEN ETPLLYIDRH LVHEVTSPQA FDGLRAHGRP VRQPGKTFAT 
MDHNVSTQTK DINACGEMAR IQMQELIKNC KEFGVELYDL NHPYQGIVHV MGPEQGVTLP 
GMTIVCGDSH TATHGAFGAL AFGIGTSEVE HVLATQTLKQ GRAKTMKIEV QGKAAPGITA 
KDIVLAIIGK TGSAGGTGHV VEFCGEAIRD LSMEGRMTLC NMAIEMGAKA GLVAPDETTF 
NYVKGRLHAP KGKDFDDAVA YWKTLQTDEG ATFDTVVTLQ AEEISPQVTW GTNLGQVISV 
NDNIPDPASF ADPVERASAE KALAYMGLKP GIPLTEVAID KVFIGSCTNS RIEDLRAAAE 
IAKGRKVAPG VQALVVPGSG PVKAQAEAEG LDKIFIEAGF EWRLPGCSMC LAMNNDRLNP 
GERCASTSNR NFEGRQGRGG RTHLVSPAMA AAAAVTGHFA DIRNIK