Gene Emin_0402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0402
Symbol
ID	6262542
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	+
Start bp	429388
End bp	430644
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	47%
IMG OID	642610869
Product	3-isopropylmalate dehydratase large subunit
Protein accession	YP_001875296
Protein GI	187250814
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR01343] homoaconitate hydratase family protein [TIGR02086] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.344506
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTCAGA CAATTGCAGA AAAAATTATT TCAAACCATT CCGGACGTCG CGTAAAAGCG 
GGGGAATTTG TTATAGCAGA CGTTGATTTA ACGGCCGTGC AGGACGGTAC CGGCCCTTTA 
ACGGTTGAAG AGCTTAAAAA AGCCGGTTTT ACCAAACTGG CAAATCCCGC AAGAACAATA 
TTATTTATTG ACCATGCGGC CCCAAGCCCC AGAAAAGAGC TTTCAAACTC ACAAGTTGTT 
TTAAGAAATT TCGCTAAAGA AACGGGCGCG ATACTTTCCG AAATTGGCGA AGGAGTTTGC 
CATCAGCTTT TGGCGGAAAA ATACGTAAAC CCCGGCGAAA TTCTAATCGG CGCTGATTCC 
CACACCTGTA CTGGCGGGGC GCTTGGCGCG TTTGCCACGG GTATGGGTTC AACGGACGTG 
GCCGTCGGCA TGGCTTTAGG TAAAACATGG CTTAAAGCGC CGCAGACTTT TAAAATAGAG 
GTTGAAGGCG CGTTTAAAAA AGGTGTAGGC GCTAAGGACC TTATTTTGCA TTTAATAGGC 
GTTATCGGCG CGGACGGCGC TACATATAAA GCGCTTGAGT TTCACGGTTC AACAATCAGA 
AATATGGAAA TGGCAGACCG CTTTACCTTA GCCAATATGG CTGTGGAAGC GGGCGCGAAA 
GCGGGCCTTT TCTTTACTGA TGAAAAAACA AGGGCTTACC TTGCCGAACG CGGCAGGGGG 
GATAATTTTA AACTTATTTC CGCCGATGAA GGCGCTGATT ACGAAAAGGT TATTAAAATA 
GACGCTTCCT CTTTAGAACC TACCGTTTCC TGCCCGCACA CGGTTGACAA TACAAAAACA 
GTAGGCGAAC TTAAAGACAT TAAAGTTAAC CAGGTTTTTA TAGGCACCTG CACAAACGGA 
CGTATAGAGG ATTTAAGAAT AGCAGCCGAG ATTTTGAAAG ATAAAAAAGT TAACCCCGGT 
ACAAGAACTT TTATAACGCC CGCCTCGCGC GACGTTATGT TAGCCGCCTT AAAAGAAGGG 
CTTATAGAAA TTTTTGTTAA GGCGGGCGCC AGCGTGCAAA CGCCTGGCTG CGGGCCTTGC 
GTTGGCGTGC ACGGCGGCAT TTTGGGCGAT GGGGAAGTTT GTTTAGCCAC CCAAAACCGC 
AATTTCCAGG GTCGCATGGG CAATACAAAA GGTTTTATTT ATCTTTCCTC GCCCGCAGTA 
GCCGCTTACA GCGCTTTAAA AGGTTATATT TCCGACCCCA GGGAAATATT AAAATAA

Protein sequence

MPQTIAEKII SNHSGRRVKA GEFVIADVDL TAVQDGTGPL TVEELKKAGF TKLANPARTI 
LFIDHAAPSP RKELSNSQVV LRNFAKETGA ILSEIGEGVC HQLLAEKYVN PGEILIGADS 
HTCTGGALGA FATGMGSTDV AVGMALGKTW LKAPQTFKIE VEGAFKKGVG AKDLILHLIG 
VIGADGATYK ALEFHGSTIR NMEMADRFTL ANMAVEAGAK AGLFFTDEKT RAYLAERGRG 
DNFKLISADE GADYEKVIKI DASSLEPTVS CPHTVDNTKT VGELKDIKVN QVFIGTCTNG 
RIEDLRIAAE ILKDKKVNPG TRTFITPASR DVMLAALKEG LIEIFVKAGA SVQTPGCGPC 
VGVHGGILGD GEVCLATQNR NFQGRMGNTK GFIYLSSPAV AAYSALKGYI SDPREILK