Gene Mpe_A0476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A0476
Symbol
ID	4784195
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	515914
End bp	517770
Gene Length	1857 bp
Protein Length	618 aa
Translation table	11
GC content	67%
IMG OID	640089034
Product	quinoprotein alcohol dehydrogenase
Protein accession	YP_001019673
Protein GI	124265669
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4993] Glucose dehydrogenase
TIGRFAM ID	[TIGR03075] PQQ-dependent dehydrogenase, methanol/ethanol family

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0260666
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGC ATCCCGTCCG TCACGCCCTG TCCGTCGCAG CGGCGCTGGC CGTCCTGGGA 
CTGTCCCAGG GTGCGCACGC CGTCAAGAAC GTCACCTGGG AAGACATCTC GAACGACGAC 
CGCACGAGCA CCGACGTCCT GAGCTACGGT CTGGGCCTGA AGGCCCAGCG CTACAGCCCG 
CTGAAGCAGA TATCGACCGC CAACGTGCAG AAGCTCGTCC CGGCATGGAG CCACTCCTTC 
GGCGGCGAGA AGCAGCGCGG CCAGGAAGGC CAGGTGCTGG TGCATGACGG CGTGATCTAC 
GCGACCAGTT CCTACTCTCG CTTCACGGCG CTCGACGCGA AGACCGGCCG GCAGCTGTGG 
ACCTACGAAC ACCGCCTGCC CGACGATATC CGTCCGTGCT GCGACGTCGT CAACCGCGGC 
CCCGCCATCT ACGGCGACAA GGTCTACTTC GGTACGCTCG ACGCACGCGT CGTGGCGCTG 
GACCGCGCCA CCGGCAAGGT GGTGTGGAAC GAGAAGTTCG GTGACCACAA GGTGGGCTAC 
ACGATGACCG GCGCGCCCTT CATCGTGAAG GACAAGAAGT CCGGTCGCGT GCTGCTGATC 
CACGGCTCGT CGGGCGACGA GTTCGGCGTC GTCGGATGGC TGTTCGCACG CGATCCCGAC 
ACCGGCGCCG AGGTCTGGGC TCGCCCGATG GTCGAGGGCC ACATGGGCCG CCTGAACGGC 
AAGGACAGCA CGGTGACCGG CGATGCGAAG GCCCCCTCGT GGCCGCGTGA CAAAGACGGC 
AAGCTGGTCG AGGCGTGGCA CCAGGGCGGC GGCGCGCCGT GGCAGACCGC GTCGTTCGAT 
GCCGAGAACA ACACCATCGT GATCGGCACC GGCAACCCGG CGCCGTGGAA CACCTGGAAG 
CGCACGAAGG AAGGCGACGA CCCGCGCAAC TGGGACAGCC TGTTCACCTC GGGTCAGGCC 
TACGTCGATG CGTCGACCGG CGAACTCAAG GGCTTCTTCC AGCACACGCC GAACGATGCC 
TGGGACTTCT CGGGCAACAA CTCGATCGTG CTGTTCGAGT ACAAGGACCC GAAGTCCGGC 
AAGCTGGTGA AGGCCGGCGC GCATGCCGAC CGCAACGGCT TTTTCTTCGT GACCGACCGC 
GAGAAGCTCG CGACCGGCGC CGGCTATCCG AACAAGCCGA CCGCGCTGCT CGGTGCGTGG 
CCGTTCGTCG ACGGCATCAC CTGGGCCAAG GGTTTCGACC TGAAGACCGG CAAGCCGATC 
GAGAACAACA ACCGTCCGCC GGCCCCCAAG CCCGGCGCCG ACAAGGGCGA GTCGATCTTC 
GTGTCGCCGC CGTTCCTGGG CGGCACCAAC TGGATGCCGA TGAGCTACAG CCCGGACACC 
GGCCTGTTCT ACATCCCGGC GAACCACTGG GCGATGGACT ACTGGACCGA GCACCTGACC 
TACAAGGCCG GCTCGGCCTA CCTCGGCCAG GGCTTCCGCA TCAAGCGGCT GTACGAGGAC 
CACGTCGGCA CGCTGCGGGC AATCGACCCG GTGACCGGCA AGATCGCGTG GGAACACAAG 
GAGAAGCTGC CGCTGTGGGC CGGCACGATG ACGACGGCCG GCGGCCTGCT GTTCACCGGC 
ACCTCCGACG GCTACGTGAA GGCCTTCGAC AGCAAGACCG GCAAGGAACT GTGGAAGTTC 
CAGACCGGCT CGGGCGTGGT CTCGGTCCCG GTGACCTGGG AGCAGGACGG CGAGCAGTAC 
GTCGGCATCC AGTCGGGCTA CGGCGGCGCC GTGCCCCTGT GGGGCGGTGA CATGGCCGAG 
ATGACCAAGA AGGTCACGCA GGGCGGCTCG ATGTGGGTCT TCAAGCTGCC CAAGTAG

Protein sequence

MSKHPVRHAL SVAAALAVLG LSQGAHAVKN VTWEDISNDD RTSTDVLSYG LGLKAQRYSP 
LKQISTANVQ KLVPAWSHSF GGEKQRGQEG QVLVHDGVIY ATSSYSRFTA LDAKTGRQLW 
TYEHRLPDDI RPCCDVVNRG PAIYGDKVYF GTLDARVVAL DRATGKVVWN EKFGDHKVGY 
TMTGAPFIVK DKKSGRVLLI HGSSGDEFGV VGWLFARDPD TGAEVWARPM VEGHMGRLNG 
KDSTVTGDAK APSWPRDKDG KLVEAWHQGG GAPWQTASFD AENNTIVIGT GNPAPWNTWK 
RTKEGDDPRN WDSLFTSGQA YVDASTGELK GFFQHTPNDA WDFSGNNSIV LFEYKDPKSG 
KLVKAGAHAD RNGFFFVTDR EKLATGAGYP NKPTALLGAW PFVDGITWAK GFDLKTGKPI 
ENNNRPPAPK PGADKGESIF VSPPFLGGTN WMPMSYSPDT GLFYIPANHW AMDYWTEHLT 
YKAGSAYLGQ GFRIKRLYED HVGTLRAIDP VTGKIAWEHK EKLPLWAGTM TTAGGLLFTG 
TSDGYVKAFD SKTGKELWKF QTGSGVVSVP VTWEQDGEQY VGIQSGYGGA VPLWGGDMAE 
MTKKVTQGGS MWVFKLPK