Gene Mlg_0544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0544
Symbol
ID	4270299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	592257
End bp	593273
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	66%
IMG OID	638125285
Product	ketol-acid reductoisomerase
Protein accession	YP_741388
Protein GI	114319705
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0059] Ketol-acid reductoisomerase
TIGRFAM ID	[TIGR00465] ketol-acid reductoisomerase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.105491
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.00154571
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAAGTCT ATTACGATAA GGACGCCGAT CTTTCCATCA TTCAGGGCAA GAAGGTCGCC 
GTCATCGGCT ACGGCTCCCA GGGCCATGCC CATGCCAACA ACCTGAAAGA GTCGGGTGTG 
GACGTGGTGG TGGGGCTGCG CGAGGGCTCC AGCTCCGCGG CCAAGGCGCA AAAGGCCGGC 
CTGGCCGTGG CCAGCATCGA GGACGCCGCC GCCCAGGCGG ACGTGGTCAT GATCCTGGCC 
CCAGACGAGC ACCAGGCGGT GATCTACCAC AACCAGATCG CCCCCAACGT GAAGCCCGGT 
GCGGCCATCG CCTTTGCCCA CGGCTTCAAC ATCCATTTCG GCCAGATCCA GCCCGCCGCC 
GACCTGGACG TGATCATGGT CGCGCCCAAG GGCCCGGGCC ACCTGGTGCG CTCCACCTAT 
GTGGAGGGCG GCGGCGTGCC CAGCCTGATC GCCATCCACC AGGACGCCAC CGGCAAGGCC 
AAGGACATCG CCCTGTCCTA TGCCTCCGCC AACGGCGGTG GCCGTGCCGG TGTCATCGAG 
ACCAGCTTCC GCGAGGAGAC CGAGACCGAC CTGTTCGGCG AGCAGGCGGT GCTCTGCGGC 
GGTATCACCT CGCTGATCCA GGCCGGGTTT GAGACCCTGG TCGAGGCGGG CTACGCCCCC 
GAGATGGCCT ACTTCGAGTG CCTGCACGAG ACCAAGCTGA TCGTCGATCT GCTCTACCAG 
GGCGGCATCG CCAACATGCG CTACTCCATC TCCAACACTG CCGAGTACGG TGACTTCACT 
CGCGGCCCGC GGGTGATCAA CGAGGAGAGC CGCGAGGCCA TGCGCGAGAT CCTGGCCGAG 
ATCCAGGAGG GCGAGTTCGC CCGCGAGTTC GTGCTGGAGA ACCAGGCCGG CTGCCCGACC 
CTCACCGCCC GCCGCCGGCT CGCCGCCGAG CACGAGATCG AGGTGGTGGG CGAGCGCCTG 
CGCGGCATGA TGCCCTGGAT CAACGCCAAC AAGCTGGTGG ACAAGGACAA GAACTGA

Protein sequence

MQVYYDKDAD LSIIQGKKVA VIGYGSQGHA HANNLKESGV DVVVGLREGS SSAAKAQKAG 
LAVASIEDAA AQADVVMILA PDEHQAVIYH NQIAPNVKPG AAIAFAHGFN IHFGQIQPAA 
DLDVIMVAPK GPGHLVRSTY VEGGGVPSLI AIHQDATGKA KDIALSYASA NGGGRAGVIE 
TSFREETETD LFGEQAVLCG GITSLIQAGF ETLVEAGYAP EMAYFECLHE TKLIVDLLYQ 
GGIANMRYSI SNTAEYGDFT RGPRVINEES REAMREILAE IQEGEFAREF VLENQAGCPT 
LTARRRLAAE HEIEVVGERL RGMMPWINAN KLVDKDKN