Gene Mpe_A0361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0361
Symbol
ID	4786852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	396929
End bp	398368
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	69%
IMG OID	640088916
Product	lactaldehyde dehydrogenase
Protein accession	YP_001019558
Protein GI	124265554
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCACCG AATACAGAAA CTACATCGAC GGCGAGTTCC TGGCCAACCG CTCGGGCGCC 
CTGATCGACG TGCACAACCC GGCCACCCAC GAGCTGCTCG CCCGTGTGCC CGACGCCCCG 
AACGACGTCG TCGACCTGGC CGTGCAGGCC GCACGCACCG CGCAGCCGGG GTGGGCGAAG 
CTGCCCGCGA TCCAGCGCGC CCAGCACCTG CGTGCCATCG CCGCCCGGCT GCGCGAGAAC 
GTGGAGGAAC TGGCCCACAC CATCACCGCC GAGCAGGGCA AGGTGCTGGG TCTGGCGCGC 
GTGGAGGTGA ACTTCACCGC CGACTACATG GACTACATGG CCGAGTGGGC GCGCCGCCTC 
GAGGGCGAGG TGCTCACCAG TGACCGCGTC GGCGAGAGCA TCTTCCTGAT GCGCAAGCCG 
ATCGGCGTGG CCGCCGGCAT CCTGCCGTGG AACTTCCCGT TCTTCCTGAT CGCGCGCAAG 
CTGGCGCCGG CGCTGATCAC CGGCAACACC ATCGTGATCA AGCCGAGCGA GATCACGCCG 
ATCAACGCCT TCGAGTTCGC GCGCCTGGCC TCGCAGACCG ACCTGCCGCG CGGCGTGTTC 
AACCTGGTGG GCGGCACCGG CGCCGGCGCC GGCGCGCAGC TCACCTCGCA CCGCGACGTG 
GGCATCGTGT CGTTCACCGG CAGCGTGGAG ACCGGCACGC GCATCATGAC CGCGGCGTCG 
AAGAACCTCA CGCGCGTGAA CCTCGAGCTC GGCGGCAAGG CACCGGCCAT CGTGCTGGCC 
GACGCCGACC TCGACCTGGC GGTGAAGGCC ATCTACGACT CGCGCGTGAT CAACACCGGA 
CAGGTGTGCA ACTGCGCCGA GCGCGTGTAC GTGCAGCGCA AGGTGGCCGA CGAGTTCACC 
AGCAAGATCG CCGCGCGCAT GGCCGGCACG CTGTACGGCG ACCCGCTGGC CCAGCCCGAC 
GTGGCGATGG GTCCGCTGGT CAGCCAGGCC GGCCTCGACA AGGTGGCGGG CATGGTGGAC 
CGCGCCCGCG CGGCCGGCGC CAGCATCGTG CAAGGTGGCC GCAAGGCCAA CCGCGACAAG 
GGCTACCACT ACGAGCCCAC CGTCATCGCG AACTGCAGCG CCGACATGGA GATCATGCGC 
AAGGAGATCT TCGGGCCGGT GCTGCCGATC CAGGTGGTGG ACGAGCTCGA CGAGGCGATC 
GCGCTGGCGA ACGACTCCGA CTACGGCCTG ACCTCGTCGA TCTTCACCAA GGACCTGAAC 
TCGGCCATGC GCGCGGTGCG CGACCTGCAG TTCGGCGAGA CCTACGTGAA CCGCGAGCAC 
TTCGAGGCGA TGCAGGGCTT CCACGCCGGC CGCAAGAAGT CGGGCATCGG CGGGGCCGAT 
GGCAAGCACG GCCTGTACGA GTTCACCGAG ACGCACGTGG TCTACATCCA GCACGGCTGA

Protein sequence

MVTEYRNYID GEFLANRSGA LIDVHNPATH ELLARVPDAP NDVVDLAVQA ARTAQPGWAK 
LPAIQRAQHL RAIAARLREN VEELAHTITA EQGKVLGLAR VEVNFTADYM DYMAEWARRL 
EGEVLTSDRV GESIFLMRKP IGVAAGILPW NFPFFLIARK LAPALITGNT IVIKPSEITP 
INAFEFARLA SQTDLPRGVF NLVGGTGAGA GAQLTSHRDV GIVSFTGSVE TGTRIMTAAS 
KNLTRVNLEL GGKAPAIVLA DADLDLAVKA IYDSRVINTG QVCNCAERVY VQRKVADEFT 
SKIAARMAGT LYGDPLAQPD VAMGPLVSQA GLDKVAGMVD RARAAGASIV QGGRKANRDK 
GYHYEPTVIA NCSADMEIMR KEIFGPVLPI QVVDELDEAI ALANDSDYGL TSSIFTKDLN 
SAMRAVRDLQ FGETYVNREH FEAMQGFHAG RKKSGIGGAD GKHGLYEFTE THVVYIQHG