Gene Mlg_1230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1230
Symbol
ID	4269761
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1433777
End bp	1434862
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	67%
IMG OID	638125980
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_742069
Protein GI	114320386
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.121054
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCCA ACATCCTGAT CACCCCGGGC GACGGTATCG GTCCGGAGAT CGTGGCCGAG 
GCGCGCAAGC TGCTGGAGGC CCTGCGTGAC GACTTCGGCT TCGACTGCAC TTTGGAAGAG 
GCCCCCATCG GCGGCGCTGG CTACGAGGCG CATGGCAAGC CGCTGCCGGA AGAGACCCTG 
GCTCTCGCCC GGGAGGCCGA TGCCATCCTA TTGGGTGCCG TGGGTGGGCC GCGCTGGGAA 
CAGCTGGATC GCCCCCTGCG TCCCGAACGC GGCCTCCTGG CCATCCGTGC GGAGTTGGGC 
CTGTTCGGCA ACCTGCGTCC AGCCATCCTC TATCCGCAAC TGGCCGAGGC CTCCAGCCTG 
CGCCATGAGA TCGTCGCCGG CCTGGACATC ATGATCGTCC GGGAGCTGAC CGGCGGCATC 
TACTTCGGTG AGCCCCGGGG CATCCGCAGG CTGGAGAACG GCGAACGCCA GGGTTACAAC 
ACCATGGTCT ACAGCGAGTC GGAGATCGAC CGCGTGGGCC GGCTGGCCTT TGACATCGCG 
AGCAAGCGCG GCAGCCGAGT CTGCTCCGTG GACAAGGCCA ACGTGCTGGA GGTCTCCGAA 
CTCTGGCGTG AGGTGATGGA ACGCGTGGCC CGGGATTACC CCGGTGTCGA GCTGAGCCAC 
ATGTACGTGG ACAACGCCGC CATGCAGTTG GTGCGTGCGC CCAAACAGTT CGACGTGGTG 
GTCACCAGCA ATCTGTTCGG TGACGTGCTC TCGGACTGTG CCGCCATGCT CACCGGCTCC 
ATTGGCATGC TGCCCTCCGC CTCGCTGGAT GTGAACAGCA AGGGGCTGTA TGAGCCGGTG 
CACGGTTCCG CGCCGGACAT CGCCGGCAAG GGGCTGGCCA ATCCGCTGGC CACCCTTCTG 
TCAGTGGCCA TGATGCTGCG CTACAGTCTG GATCAGGGCG CCCTCGCCGA CCGGGTGCAG 
CAGGCGGTGG GTGATGTGCT CAACCAGGGG CTGCGCACGC CGGATATCGC CGCCCGCCAG 
TCGCGCACCG TCAGCACCGC CGAGATGGGT GACGCGGTGG TGGCCGCGCT GCGTGCCCGG 
GGCTGA

Protein sequence

MTANILITPG DGIGPEIVAE ARKLLEALRD DFGFDCTLEE APIGGAGYEA HGKPLPEETL 
ALAREADAIL LGAVGGPRWE QLDRPLRPER GLLAIRAELG LFGNLRPAIL YPQLAEASSL 
RHEIVAGLDI MIVRELTGGI YFGEPRGIRR LENGERQGYN TMVYSESEID RVGRLAFDIA 
SKRGSRVCSV DKANVLEVSE LWREVMERVA RDYPGVELSH MYVDNAAMQL VRAPKQFDVV 
VTSNLFGDVL SDCAAMLTGS IGMLPSASLD VNSKGLYEPV HGSAPDIAGK GLANPLATLL 
SVAMMLRYSL DQGALADRVQ QAVGDVLNQG LRTPDIAARQ SRTVSTAEMG DAVVAALRAR 
G