Gene Mlg_0489 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0489
Symbol
ID	4268357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	534659
End bp	535825
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	71%
IMG OID	638125229
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_741333
Protein GI	114319650
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.410888
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.730231
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAAAG GCAGGACCTG GCGGGTGGCA GTGTGTCCCG GCGATGGCAT CGGGCCGGAG 
GTGATGGCGC CCACGGTCGC CGCGCTGCGG GCGGTGGCCG GACGCGAGGG GCTGGCGCTG 
GAGCTCCAGC ACTACGACTG GCCGTCCCAC GACTGGCACC GTCGGCACGG CGAGATGATG 
CCCGGGGACT GGCGCGAGCA GTTGGCCGCT CACGACGCCA TCCTGCTCGG CGCCCTGGGC 
GACCCCGGGC CGACCAATGA TCCTGATCGC TACCTGCTCT CAGATGGTGT GTCGCTGGCG 
CCGCTGCTGC AATTGCGCAA GGGGTTCGAC CTGTGGGCCT GCGAGCGGCC GGCGGTCCGG 
CTGCCCGGTA CGCCTCAGTA CCTGGCCGAC CCCCGCGCCG AGGAACTGGA CATGCTGGTG 
ATCCGCGAGA ACAGCGAGGG CGAGTATGTG GCCCAGGGCG GGCGCCTGGC GCCGGGCACG 
GCGCGCGAGG TGGCCACTCA GGTGGAGGTG TTCACCCGCC TGGCCACCGA GCGGATCATC 
CGCCACGCCT TCGAGCGCGC CCTACAGCGG GCCCACCTGC GCCAGACCGG CGAGCGCCCA 
CCGCGCCCTT TTCCGCGGAC CGGCGGTGGC GAGGCCAACG CCCAGGTCTG CCTGATCACC 
AAGCGAAACG CCCAGGCCTA CTGGGGCGAG ATGTGGACGG AGATCTTCGC CGAGGTGGCG 
CCCGACTACC CCGAGATCGC CACCCACCAT GAACTGGTGG ACGCCGCCTG CATGAAGTTC 
GTGACCCGTC CCTGGGTGTT CGACGTGGTG GTGGCCAGCA ATCTCCATGG CGACATCCTC 
ACTGACCTGG CCGCGGTGCT CTGCGGCGGT ATGGGGGTTG CCCCCTCCTG TAACATCAAC 
CCGCAGGATC GCCGTGTGCC ACCCCTGTTC GAGCCCACCC ACGGCAGCGC CCCGGACATC 
GCCGGGCAAG GACTGGCCGG GCCTGAGGCC ATGCTGCTGA CCGCAGCGAT GATGCTGGAC 
TGGATGGGCG AGGAGGACCC GGCCGCGGCC CGCGCCGGTG AACGCCTGCG CCTGGCGGTA 
GCCGCCGACC TGCAGACCGG TAGCGGCGAG GCGCGGGGCA CCGAGGCAGT GGGGGCGGCC 
ATCCTGGACC GTCTGGATCA GCAGTGA

Protein sequence

MAKGRTWRVA VCPGDGIGPE VMAPTVAALR AVAGREGLAL ELQHYDWPSH DWHRRHGEMM 
PGDWREQLAA HDAILLGALG DPGPTNDPDR YLLSDGVSLA PLLQLRKGFD LWACERPAVR 
LPGTPQYLAD PRAEELDMLV IRENSEGEYV AQGGRLAPGT AREVATQVEV FTRLATERII 
RHAFERALQR AHLRQTGERP PRPFPRTGGG EANAQVCLIT KRNAQAYWGE MWTEIFAEVA 
PDYPEIATHH ELVDAACMKF VTRPWVFDVV VASNLHGDIL TDLAAVLCGG MGVAPSCNIN 
PQDRRVPPLF EPTHGSAPDI AGQGLAGPEA MLLTAAMMLD WMGEEDPAAA RAGERLRLAV 
AADLQTGSGE ARGTEAVGAA ILDRLDQQ