Gene Mpe_A2064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2064
Symbol
ID	4785941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	2205510
End bp	2206583
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	68%
IMG OID	640090632
Product	putative zinc-containing alcohol dehydrogenase
Protein accession	YP_001021255
Protein GI	124267251
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.422678
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCAAGA TGAAAGCCGC CGTCTTCGTC GAGCCGGGAC GCATCGTCCT CGAGGACAAG 
CCGATTCCGG ACATCGGTCC GCTCGATGCG CTGGTGCGCA TCACCACCAC GACCATCTGC 
GGCACCGACG TCCACATCCT GAAGGGCGAG TACCCGGTCG CCCGCGGCCT CACCGTCGGT 
CACGAACCCG TGGGGGTGAT CGAGAAGCTC GGTTCGGCCG TCGAGGGCTA CGAGGAAGGG 
CAGCGCGTCG TCGCGGGCGC CATCACGCCC AGCGGCTGGA GCAATGCCTG CCTCTGCGGT 
GCTTGCTCGC AGGACGGCGC GGGAACCGCG CACGGGTGGA AGCCGATGGG TGGCTGGCGC 
TTCGGCAACA CCATCGACGG CTGCCAAGCC GAGTACGTGC GCGTGCCCGA CGCCATGGCC 
AACCTGGCGC GGGTGCCCGA CGGCCTCACC GACGAGCAGG TGCTGATGTG CCCCGACATC 
ATGTCGACCG GCTTCGGCGG CGCCGAAAGT GCAGGCATCC GAATCGGTGA CATTGTGGCG 
GTGTTTGCTC AAGGCCCGAT CGGGCTTTGC GCAACAGCCG GCGCGAAGCT GTGCGGTGCC 
AGCGTCGTGA TCGGCGTGGA CCGGCTGCCC GAGCGTCTGG CGATGGCTCG GCGCATGGGG 
GCCGATCATG TCATCGATGC CTCGCGGGTC GATCCGGTCG AGGAGATCGC ACGGCTGACC 
GGTGGCCGCG GCGTCGACGT GGCGATCGAG GCGCTGGGGA CACAGCAGAC TTTCGAGTCG 
TGCTTGCGGG TTCTGCGTCC CGGTGGCACG CTGTCCAGTC TGGGCGTGTA CTCCACCGAC 
CTGAAGATTC CACTCGGCGC CTTTGCTGCG GGGTTGGGCG ATCACAAGAT CGTGACGACG 
CTGTGCCCGG GCGGCAAGGA ACGCATGCGG CGGCTGATGT CGGTGATCGA GCGCGGGCGC 
ATCGATCTGG GCGCCATGGT CACGCACCGC TACCGGCTCG ACGACATCGA GACCGCCTAC 
GAGCTCTTCG GTCAGCAGCG CGATGGCGTG CTGAAGATCG CGATCACGCC GTGA

Protein sequence

MPKMKAAVFV EPGRIVLEDK PIPDIGPLDA LVRITTTTIC GTDVHILKGE YPVARGLTVG 
HEPVGVIEKL GSAVEGYEEG QRVVAGAITP SGWSNACLCG ACSQDGAGTA HGWKPMGGWR 
FGNTIDGCQA EYVRVPDAMA NLARVPDGLT DEQVLMCPDI MSTGFGGAES AGIRIGDIVA 
VFAQGPIGLC ATAGAKLCGA SVVIGVDRLP ERLAMARRMG ADHVIDASRV DPVEEIARLT 
GGRGVDVAIE ALGTQQTFES CLRVLRPGGT LSSLGVYSTD LKIPLGAFAA GLGDHKIVTT 
LCPGGKERMR RLMSVIERGR IDLGAMVTHR YRLDDIETAY ELFGQQRDGV LKIAITP