Gene Mlg_2726 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2726
Symbol
ID	4270980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	3093025
End bp	3094545
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	63%
IMG OID	638127488
Product	aldehyde dehydrogenase
Protein accession	YP_743556
Protein GI	114321873
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCTACG CAAACCCCGG TGAGCGCGAC GCGAAAGTCC AGTTCAAACC CCGCTACGGA 
AACTTCATCA ATGGCGAGTG GGTAGAACCG GCCAGTGGCC AGTATTTTGA GAACATCACC 
CCGGTAACGG GAGAAGTATT CTGCGAAGTC GCCCGGTCCA ATGCCGATGA CGTGGAACGC 
GCCCTGGACG CGGCCCACGC CGCCAAAGAT GCCTGGGGGA AAGCGTCGGT GACCGAGCGT 
GCCAACGTGC TGCTGAAGAT CGCCGATCGC ATGGAGGCCA ACTTGGAGCG CCTGGCGGTG 
GCCGAGACCT GGGACAACGG GAAGCCCGTG CGTGAAACCC TCAACGCCGA TCTCCCGTTG 
GCCATTGATC ACTTCCGCTA CTTCGCCGGG GCCATCCGGG CCCAGGAAGG CGGTATCAGC 
GAGATCGACC ACGACACCAT CGCCTACCAC TTTCATGAGC CGCTGGGCGT GGTGGGGCAA 
ATCATCCCCT GGAACTTCCC GCTGCTGATG GCCACCTGGA AGATCGCCCC GGCCCTGGCT 
TGTGGCAACT GCATCGTGCT CAAGCCCGCC GAGCAGACAC CGGCGTCCAT CCTGGTGTTG 
ATGGAGTGCA TCCAGGACGT GCTGCCCCCG GGGGTGCTGA ACGTGGTGAA CGGCTTCGGT 
GTCGAGGCCG GCAAGCCGCT GGCCACCAGC AACCGCATCG CCAAGGTGGC GTTCACCGGC 
GAGACCACCA CCGGGCGGCT GATCATGCAG TACGCCGCCG AGAACATCAT CCCGGTAACC 
CTGGAGCTGG GCGGCAAATC GCCGAACATC TTCATGGCCG ACGTGATGGA CCAGGATGAC 
GACTTCCTGG ACAAGGCCAT TGAGGGGATG ACCCTGGCGT GCCTGAACCA GGGCGAGGTC 
TGCACCTGTC CCTCGCGCGC GCTGATCCAG GAGGACATCT ACGACGATTT CATTGCCAAG 
GTGATCGACA GGTTCAGCAT GGTGAAACAG GGCAACCCGC TGGACACCGA AACCATGATC 
GGGGCCCAGG CCTCCTCCGA GCAGATGGAG AAGATCCTGA GCTACATGGA CATCGGTCGG 
CAGGAAGGCG CCGAGTGCCT CATCGGCGGC GACCGCGCCG AGATCGGCGG TGATTTCCAG 
AACGGCTACT ACGTGCAGCC GACCCTGTTC CGCGGCCACA ACAAGATGCG CATCTTCCAG 
GAGGAGATCT TCGGCCCGGT GGTTTCCGTC ACCACTTTCA AGGACGAGGC CGAGGCGCTG 
GAGCTGGCCA ACGACACCCT CTACGGCCTG GGGGCCGGTC TCTGGAGCCG CAGCGCACAC 
ACCACCTACC GCATGGGCCG GGCCATCCAG GCCGGCCGGG TGTGGACCAA CTGCTACCAC 
CTGTACCCGG CCCATGCCGC CTTTGGTGGT TACAAGCAGT CCGGCATCGG GCGGGAGAAC 
CACCAGATGA TGCTGGAGCA CTACCAGCAG ACCAAGAACC TGCTGGTGAG CTACAGCCCC 
AAGGCCATGG GCTTTTTCTA A

Protein sequence

MIYANPGERD AKVQFKPRYG NFINGEWVEP ASGQYFENIT PVTGEVFCEV ARSNADDVER 
ALDAAHAAKD AWGKASVTER ANVLLKIADR MEANLERLAV AETWDNGKPV RETLNADLPL 
AIDHFRYFAG AIRAQEGGIS EIDHDTIAYH FHEPLGVVGQ IIPWNFPLLM ATWKIAPALA 
CGNCIVLKPA EQTPASILVL MECIQDVLPP GVLNVVNGFG VEAGKPLATS NRIAKVAFTG 
ETTTGRLIMQ YAAENIIPVT LELGGKSPNI FMADVMDQDD DFLDKAIEGM TLACLNQGEV 
CTCPSRALIQ EDIYDDFIAK VIDRFSMVKQ GNPLDTETMI GAQASSEQME KILSYMDIGR 
QEGAECLIGG DRAEIGGDFQ NGYYVQPTLF RGHNKMRIFQ EEIFGPVVSV TTFKDEAEAL 
ELANDTLYGL GAGLWSRSAH TTYRMGRAIQ AGRVWTNCYH LYPAHAAFGG YKQSGIGREN 
HQMMLEHYQQ TKNLLVSYSP KAMGFF