Gene EcSMS35_0079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0079
Symbol	leuA
ID	6143537
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	88592
End bp	90163
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	53%
IMG OID	641614980
Product	2-isopropylmalate synthase
Protein accession	YP_001742196
Protein GI	170683572
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR00973] 2-isopropylmalate synthase, bacterial type

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	0.999327
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGC AAGTTATTAT TTTCGATACC ACATTGCGCG ACGGTGAACA GGCGTTACAG 
GCAAGCCTGA GTGCGAAAGA AAAACTGCAA ATTGCGCTGG CCCTTGAGCG TATGGGTGTT 
GACGTGATGG AAGTCGGTTT CCCCGTCTCT TCGCCGGGCG ATTTCGAATC GGTGCAGACC 
ATCGCCCGCC AGGTCAAAAA CAGCCGCGTA TGTGCGTTAG CTCGCTGCGT GGAAAAGGAT 
ATCGACGTGG CAGCTGAATC TCTGAAAGTT GCCGAAGCCT TCCGTATCCA TACCTTTATT 
GCCACTTCAC CAATGCACAT TGCCACCAAG CTGCGTAGCA CGCTGGACGA AGTAATCGAA 
CGCGCTATCT ATATGGTGAA ACGCGCCCGT AATTACACCG ATGATGTTGA ATTTTCTTGC 
GAAGATGCCG GACGCACACC CATTGCCGAT CTGGCGCGCG TGGTTGAAGC GGCGATTAAC 
GCCGGTGCCA CCACCATCAA CATTCCGGAC ACCGTGGGCT ACACCATGCC GTTTGAGTTC 
GCCGGAATCA TCAGCGGGCT GTATGAACGC GTGCCTAACA TCGACAAAGC CATTATCTCC 
GTACATACCC ACGACGATTT AGGCCTGGCA GTTGGCAACT CACTGGCGGC GGTACATGCC 
GGAGCGCGCC AGGTGGAAGG TGCAATGAAT GGGATCGGCG AGCGAGCCGG TAACTGTTCG 
CTGGAAGAAG TGATCATGGC GATCAAAGTT CGTAAGGATA TTCTCAACGT TCATACCGCC 
ATTAATCACC AGGAGATATG GCGCACCAGC CAGTTAGTTA GCCAGATTTG TAATATGCCG 
ATCCCGGCAA ACAAAGCCAT TGTTGGCAGC GGCGCATTCG CACACTCCTC CGGTATCCAC 
CAGGATGGTG TACTGAAAAA CCGTGAAAAC TACGAAATCA TGACACCAGA ATCTATTGGT 
CTGAACCAAA TCCAGCTGAA TCTGACCTCT CGTTCGGGGC GTGCGGCGGT GAAACATCGC 
ATGGATGAGA TGGGATATAA AGAAAGTGAA TATAATTTAG ACAACCTGTA CGACGCTTTC 
CTGAAGCTGG CGGACAAAAA AGGCCAGGTG TTTGATTACG ATCTGGAGGC GCTGGCCTTC 
ATCGGTAAGC AGCAAGAAGA GCCGGAGCAT TTCCGTCTGG ATTACTTCAG CGTGCAGTCA 
GGTTCTAACG ATATTGCCAC TGCCGCCGTC AAACTGGCCT GTGGCGAAGA AGTCAAAGCA 
GAAGCCGCCA ACGGTAACGG TCCGGTCGAT GCCGTCTACC AGGCGATAAA CCGCATCACT 
GACTATAACG TCGAACTGGT GAAATACAGC CTGACCGCCA AAGGTCACGG TAAAGATGCG 
CTGGGTCAGG TGGATATTGT CGCCAACTAC AACGGTCGCC GCTTCCACGG CGTCGGCCTG 
GCCACCGATA TTGTCGAGTC CTCCGCCAAA GCCATGGTGC ACGTACTGAA CAATATCTGG 
CGTGCCGCAG AAGTCGAAAA AGAGTTGCAA CGCAAAGCTC AACACAACGA AAACAACAAG 
GAAACCGTGT GA

Protein sequence

MSQQVIIFDT TLRDGEQALQ ASLSAKEKLQ IALALERMGV DVMEVGFPVS SPGDFESVQT 
IARQVKNSRV CALARCVEKD IDVAAESLKV AEAFRIHTFI ATSPMHIATK LRSTLDEVIE 
RAIYMVKRAR NYTDDVEFSC EDAGRTPIAD LARVVEAAIN AGATTINIPD TVGYTMPFEF 
AGIISGLYER VPNIDKAIIS VHTHDDLGLA VGNSLAAVHA GARQVEGAMN GIGERAGNCS 
LEEVIMAIKV RKDILNVHTA INHQEIWRTS QLVSQICNMP IPANKAIVGS GAFAHSSGIH 
QDGVLKNREN YEIMTPESIG LNQIQLNLTS RSGRAAVKHR MDEMGYKESE YNLDNLYDAF 
LKLADKKGQV FDYDLEALAF IGKQQEEPEH FRLDYFSVQS GSNDIATAAV KLACGEEVKA 
EAANGNGPVD AVYQAINRIT DYNVELVKYS LTAKGHGKDA LGQVDIVANY NGRRFHGVGL 
ATDIVESSAK AMVHVLNNIW RAAEVEKELQ RKAQHNENNK ETV