Gene Mlg_1412 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1412
Symbol
ID	4270410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1618506
End bp	1619522
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	71%
IMG OID	638126168
Product	alcohol dehydrogenase
Protein accession	YP_742251
Protein GI	114320568
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID	[TIGR02822] zinc-binding alcohol dehydrogenase family protein

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.498942
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGCAG AGGATACGGA ACGCACCACC ATGCGGGTGA TGGCGCTGGA GGCCCCGGGG 
CAGGCCCTGC AGGCCCAATC CTGGCCCGTC CCGGAGCCCG GCATCGGGCA ACTCCGCCTC 
CGGGTGCGCG CCTGCGCCGT CTGCCGCACG GATCTGCACG TGGTGGACGG CGAGTTGCCG 
GACCCCGTAC TGCCCATCAT CCCGGGCCAT GAGATCGTCG GTGTGGTGGA CCGCGTGGGC 
GAGGGCTGCC AAAGGTACCG CCCGGGCGAC CGGGTGGGGG TGCCCTGGCT CGGCCATACC 
TGCGGGACCT GCGATCATTG CCGCGCCGGC CGGGAAAACC TCTGCGACCA GGCACGGTTC 
ACCGGCTACC AGTTGCAGGG CGGTTACGCT GAATACGCCA TCGCCGACGA GCGGTTCTGC 
TTCCCGATCC CCGCCGCGTA CACCGACGCC GGCGCCGCGC CACTGTTGTG CGCCGGGCTC 
ATCGGTCACC GCTCACTGAG CATGGCCGGC GACGACGCCC GCCGTCTGGG GATCTACGGT 
TTCGGTGCGG CGGCCCATAT CGTGGCCCAG GTGGCGCGCC ACCAGGAGCG CGACCTCTAC 
GCCTTCACCC GTCCGGGGGA TCAAAAGGCC CAGGCGTTTG CCCGCGCCCT CGGCGCCTGC 
TGGGCCGGGC CCTCGGACCG GCTGCCACCC AAGCCATTGG ACGCGGCCAT CATCTTTGCC 
CCCGTCGGCG ACCTGGTCCC CCAGGCCCTG CGTGCGGTGC GCAAGGGCGG CCGGGTGGTC 
TGTGGCGGCA TCCACATGAG CGATATCCCC TCGTTCCCCT ACGCCTGGCT CTGGGGCGAA 
CGCAGCCTCT GCTCGGTCGC CAACCTGACC CGGGCCGATG GTGAGGCCTT CATGGCCCTT 
GCGCCCGAGG TGCCGGTACG CACGGAAGTG GTGGAGTACC CCCTGGACCA GGCCAATCAG 
GCCCTGGATG ACCTGCGCGG CGGTCGCCTG CAGGGCGCCG CCGTGCTGAT CCCTTAG

Protein sequence

MEAEDTERTT MRVMALEAPG QALQAQSWPV PEPGIGQLRL RVRACAVCRT DLHVVDGELP 
DPVLPIIPGH EIVGVVDRVG EGCQRYRPGD RVGVPWLGHT CGTCDHCRAG RENLCDQARF 
TGYQLQGGYA EYAIADERFC FPIPAAYTDA GAAPLLCAGL IGHRSLSMAG DDARRLGIYG 
FGAAAHIVAQ VARHQERDLY AFTRPGDQKA QAFARALGAC WAGPSDRLPP KPLDAAIIFA 
PVGDLVPQAL RAVRKGGRVV CGGIHMSDIP SFPYAWLWGE RSLCSVANLT RADGEAFMAL 
APEVPVRTEV VEYPLDQANQ ALDDLRGGRL QGAAVLIP