Gene Mlg_0032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0032
Symbol
ID	4268889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	35512
End bp	36552
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	67%
IMG OID	638124759
Product	aldo/keto reductase
Protein accession	YP_740881
Protein GI	114319198
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTACC GCAAACTGGG TCATACCGAT ATCGAGGTCA GCGCCCTCTG CCTGGGCACC 
ATGACCTTCG GCGAGCAGAA CACCGAGGCC GAGGCCCATG AGCAACTGGA CCAGGCCCTC 
GCCCGGGGGA TCAACTTCAT CGACACCGCC GAGATGTACC CGGTGCCGGC CAAAAGCGAG 
ACCGGCGGCC GCACCGAGCG CTATATCGGC AGCTGGCTGA AGCGGCGCCG GCGCCGCGAG 
GACGTGGTGC TGGCCACCAA GATCGCGGGG CCGGGCCTGG AGACGGTACG TGAGGGGAGG 
ACCCGCTACA CCCACGCCCA CCTGGTGGAG GCGGTGGAGG GCTCCCTGCA ACGGTTGCAG 
ACCGACTATA TCGACCTCTA CCAACTGCAC TGGCCGGAGC GGAAGACCAA CTATTTCGGC 
AAGCTGGGCT ACCAGCCCGA TCCGCGGGAG CCGGACCCCA TCCCGCAGCT TCGCGCCACC 
CTGGAGGCGC TTTATGACCT GGTGGAGGCG GGCAAGATCC GCCACATCGG GCTGTCCAAC 
GAGACCGCCT GGGGGGTGAT GCGCTGCCTG TGGTTGGCCG AGCAGCAGGA TCTGCCGCGC 
GTGGTCAGTG TCCAGAACCC CTACAACCTG CTCAACCGCA GCTACGAGGT GGGTCTCGCC 
GAGGTCTCCC ACCGCGAGGG TGTGGGGCTG ATGGCGTACT CGCCACTGGC CTTCGGGGTG 
CTCAGCGGCA AGTACCTGGA CGGCCGCTGG CCCGAGGGGG CCCGTCTGTC GCTGTTCGAA 
CAGTTCCAGC GCTACACCGG GCAGCGCGGG GTGCAGGCGA CCGCCGATTA TGTGGCCCTG 
GCCCACCGCT TTGGCCTGGA TCCGGCACAG ATGGCCCTGG CCTGGGCCAC CTCACGCCCC 
TTCGTGACCA GCACCGTCAT CGGTGCCACC GATCTGAACC AGCTGGAGAC CAACATCGAC 
AGCATGGACC TGACCCTGGA CGATGAGCTG CTGGAGGCCA TCGACGCCGT CCACGCCGGC 
AACCCCAACC CCTGCCCCTG A

Protein sequence

MEYRKLGHTD IEVSALCLGT MTFGEQNTEA EAHEQLDQAL ARGINFIDTA EMYPVPAKSE 
TGGRTERYIG SWLKRRRRRE DVVLATKIAG PGLETVREGR TRYTHAHLVE AVEGSLQRLQ 
TDYIDLYQLH WPERKTNYFG KLGYQPDPRE PDPIPQLRAT LEALYDLVEA GKIRHIGLSN 
ETAWGVMRCL WLAEQQDLPR VVSVQNPYNL LNRSYEVGLA EVSHREGVGL MAYSPLAFGV 
LSGKYLDGRW PEGARLSLFE QFQRYTGQRG VQATADYVAL AHRFGLDPAQ MALAWATSRP 
FVTSTVIGAT DLNQLETNID SMDLTLDDEL LEAIDAVHAG NPNPCP