Gene Mlg_2059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2059
Symbol
ID	4270445
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2333533
End bp	2334633
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	67%
IMG OID	638126815
Product	alcohol dehydrogenase
Protein accession	YP_742891
Protein GI	114321208
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.286272
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAAGA AGACAATGCA CGCCGTGCAA CTGACCCGCC ACGGTGATTT GGATGCCCTG 
GTCTATCGCG ACGATGTGCC GCGCCCGGAA CCGGCGAGGG GCGAGGTGCT GATCGAGGTC 
AGTGCCTGCG GCATGAACAA CACCGACGTC TGGGTGCGGC AGGGGGCCTA CGGCACCGAG 
ACCGATCCGG ACAGTGTCTC CACCTGGCGC CGGGGCCGCT CGACCCTGAC CTTTCCGCGC 
ATCCAGGGCA CCGATATCGT CGGCACCGTC GTGGCCGTAG GCGAGGGCGT GCCCGAGGCC 
CGCATCGGTG AGCGGGTCAT GGTGGACTTC AGCCTCTATA ACCGGGCGGA TGACAGCCTC 
GCCGATATCG ACTACATCGG CCACGGCCGT GACGGGGGCT ATGCCGAGTA CACTGCGGTG 
CCCTCGGAGA ACGCCCACGT GGTGGATACC GATATGAGCG ACGCCGAACT GGCGACCTTC 
TGCTGTGCCT ATCTGACCGG CGAGCACATG CTGGAACGGG CCCGGGTGCA GGCGGGGGAG 
CGGGTGCTGG TGACCGGTGC CTCCGGCGGC GTGGGCTCCG GCATCATACA GCTGTGCCGG 
GCGCGGGGCG CCATCCCCTA CGCCGTGACC AGCCGGGACA AGGCAGAGGC GGTGCGCGGG 
ATTGGTGCCG AAGCGGTCAT CCCCCGTGAG AGTGGCGATC TGGTGACGGC GGTGGACCAG 
GCCACCGAAG GCCGGCCCAT CGACGTGGTG GCCGATCTGG TGGCCGGCCC GCTGTTCAAC 
GACCTGCTGC GGGTGCTGCG TCCGGAGGGC CGGTATACCA CGGCCGGCGC CATCGCGGGG 
CCCGTGGTGC AGTTGGATCT GCGGACGCTC TATCTCAAGC ATCTGCAACT GCACGGCTCC 
TCCCAGGGCA CCCGCGGGGA TTTTCGGCGC CTGGTCGGCT ATATCGAGAG GGGGCAGGTG 
CGGGCGCTGC TGTACAACAC CTACCGGCTC TCCGATTTCC ATCGTGCGCA GCGGGATTTC 
ATGGAAAAGT CCTATATCGG CAAGCTGGTG GTGGTGCCTG ATCGAAAATG GGACGAGGTG 
GGCCGCCCCC ATGCGCGCTA A

Protein sequence

MAKKTMHAVQ LTRHGDLDAL VYRDDVPRPE PARGEVLIEV SACGMNNTDV WVRQGAYGTE 
TDPDSVSTWR RGRSTLTFPR IQGTDIVGTV VAVGEGVPEA RIGERVMVDF SLYNRADDSL 
ADIDYIGHGR DGGYAEYTAV PSENAHVVDT DMSDAELATF CCAYLTGEHM LERARVQAGE 
RVLVTGASGG VGSGIIQLCR ARGAIPYAVT SRDKAEAVRG IGAEAVIPRE SGDLVTAVDQ 
ATEGRPIDVV ADLVAGPLFN DLLRVLRPEG RYTTAGAIAG PVVQLDLRTL YLKHLQLHGS 
SQGTRGDFRR LVGYIERGQV RALLYNTYRL SDFHRAQRDF MEKSYIGKLV VVPDRKWDEV 
GRPHAR