Gene Mlg_1228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1228
Symbol
ID	4269759
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1431600
End bp	1433009
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	68%
IMG OID	638125978
Product	isopropylmalate isomerase large subunit
Protein accession	YP_742067
Protein GI	114320384
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.0896395
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGGCA AGACCCTTTA CGACAAGCTC TGGGATGCGC ATGTGGTCCG CGAGAACCCC 
GACGGTTCCG CGCTGCTGTA TGTGGATCGC CAGCTGTTGC ACGAAGTGAC CTCGCCGCAG 
GCCTTCGAGG GGTTGCGCCT GGCCGGCCGC CGCCCCTGGC GCGTGGAGGC CAACCTGGCG 
GTCACCGACC ACAACGTGCC GACCACCAAC CGCGCCCAGG GGATCGCCGA TCCGGTCTCG 
CGGGTGCAGG TGCAGACCCT AGACAGGAAC TGCGAGGAGT TCGGGATCAC CGAGTACGGC 
ATGCTCGATC GCCGCCAGGG CATTGTCCAC GTCGTGGGGC CGGAGCAGGG GGCCACCCAG 
CCCGGCATGA CAGTGGTCTG CGGCGACTCC CACACCTCCA CCCACGGTGC CCTGGGCGCG 
CTGGCATTCG GTATCGGCAC CTCCGAAGTG GAACATGCGT TGGCCACCCA GACGGTGGTG 
CAGAAGAAGG CCAAACGCAT GCTGGTGCGG GTGGATGGCC AGTTGGGTCG CGGCGTCACC 
GCCAAGGACG TGGTGCTGGC CATTATCGGC CGGATCGGCA CCGCAGGGGG GACCGGCTAT 
GCCATCGAGT TCGGCGGCGA GGCTATCCGC TCGCTCTCGG TCGAGGGCCG CATGACCGTC 
TGCAATATGT CCATCGAGGC GGGCGCCCGC TGCGGCATGG TGGCGGTGGA CGACATGACC 
ATCGACTACG TGCGCGGCCG CCCGTTTGCG CCGAAGGGCG AGCACTGGGA CCAGGCCGTC 
GCCTACTGGA AGACCCTGCA CAGTGACCCG GATGCCGAGT TCGATCAGGT GGTGGTGCTG 
GACGCCGCTG AGATCGAGCC GCAGGTCACC TGGGGGACCT CCCCGGAGAT GGTGGTGCCG 
GTGGGCGGCT GCGTGCCTAA CCCGTTCGAG GAGCAGGACG AGGTCAAGCG CAGCAGCATG 
GGGCGTGCCC TGGACTACAT GGGCCTGCAG CCCGGCACGC CCATCAAGGA GATCCGGCTG 
GACCGCGTCT TTATCGGCTC CTGCACCAAC TCGCGCATCG AGGACCTGCG CGCCGCCGCC 
GAAGTGGTCC GCGGTCACAA GGTGGCGGAC AGCCTCACCC AGGCGCTGGT GGTGCCGGGT 
TCCGGGGTGG TCAAGGAGCA GGCCGAAAAG GAGGGCCTGG ACCGGGTCTT CATCGAGGCC 
GGTTTCGAGT GGCGGGAGCC GGGCTGCTCC ATGTGCCTGG CCATGAACGC CGATCGCCTG 
CAATCGGGCG AGCGCTGTGC CTCCACCTCG AACCGTAATT TCGAGGGCCG CCAGGGGCAG 
GGCGGGCGTA CCCACCTGGT GAACCCGGCG ATGGCCGCCG CCGCCGCCAT CGCCGGCCAT 
TTCGTGGATG TGCGCCACTG GCCCGAGTAG

Protein sequence

MSGKTLYDKL WDAHVVRENP DGSALLYVDR QLLHEVTSPQ AFEGLRLAGR RPWRVEANLA 
VTDHNVPTTN RAQGIADPVS RVQVQTLDRN CEEFGITEYG MLDRRQGIVH VVGPEQGATQ 
PGMTVVCGDS HTSTHGALGA LAFGIGTSEV EHALATQTVV QKKAKRMLVR VDGQLGRGVT 
AKDVVLAIIG RIGTAGGTGY AIEFGGEAIR SLSVEGRMTV CNMSIEAGAR CGMVAVDDMT 
IDYVRGRPFA PKGEHWDQAV AYWKTLHSDP DAEFDQVVVL DAAEIEPQVT WGTSPEMVVP 
VGGCVPNPFE EQDEVKRSSM GRALDYMGLQ PGTPIKEIRL DRVFIGSCTN SRIEDLRAAA 
EVVRGHKVAD SLTQALVVPG SGVVKEQAEK EGLDRVFIEA GFEWREPGCS MCLAMNADRL 
QSGERCASTS NRNFEGRQGQ GGRTHLVNPA MAAAAAIAGH FVDVRHWPE