Gene Mpe_A3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3044
Symbol
ID	4784966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	3234663
End bp	3236090
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	72%
IMG OID	640091615
Product	methanol utilization control sensor protein MoxY, putative
Protein accession	YP_001022232
Protein GI	124268228
COG category	[T] Signal transduction mechanisms
COG ID	[COG3851] Signal transduction histidine kinase, glucose-6-phosphate specific
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.739153
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTTCT GGAATCGGCG CCGCGCCGGC GGGTGGCCGG CCGATACCAT GCGGCGCATG 
AGTCTGCGCT TGAAGATCCA CCTGATCGTC GGTGTGCTGG TGGCGCTGTG CCTGGTGGCC 
GTCATGGCGC TGCAGGTCAA GAGCGCGCGC GACGCGATCC GGGAGGAGAT CGAGGCCGCC 
AACCGCGTGG CCGCGCAGTT GCTGCAGCGC ACGCTGTGGC TGCAGGCGGC GCGCGGCACG 
CCGGCGATGA TCGGCTACCT GCAGGGGGTG GGCCGCGTGC GGGCGAACGA CATCACGCTG 
CTCGACGGCA AGGGCGAACT GGTCTACCAG TCGCCGCCGT CGCCCTACAA GTCGGGCCGA 
GATGCGCCCG ACTGGTTCGT CGATTTCATG GCGCCGCCGC TGGAGCCGCA GAAGATGGAT 
TTCCCCGACG GCACGCTGGT GGTGCGGGCC GACCCCTCGC GCGCGGCGCT CGATGCCTGG 
GACCAGTTCG CGGTGCTGGG GTTGGCCGCG CTGGGCGTGT TGGCGGTTCT CAACCTGGTG 
GTGTTCTGGG TGGTCGGCCG CACGGTCGAG CCGTTCGGGC AGATCGTCGC GGCGCTCAAC 
CGCATCGAGG CCGGGCAGCT CGACGTCACG CTGCCGCGCC TGCCGGGCAC CGAGGCGGCT 
GCCATCGGCG CCGCCTTCAA CCGCATGGTG GTGGGCGTCA GCGAGCGCAT CGAGGCCGAG 
CGCCGGGCCG CGCAGGCCGA GCACGAGCTG TCCGACCGCC GCGACCTGGC ACGCTGGATC 
GACCGCCACC TGGAGCAGGA ACGCCGCCTG ATCGCTCGTG AGCTGCACGA CGAACTGGGC 
CAGTCGGTGA CCGGCATGCG CAGCCTGGCG CTGTCGGTGG CGCAGCGTGT CGCCATCGCC 
GACCCCGAGG CCGCGCGCGC CGCGCAGGTG ATCGCCGACG AAAGCTCGCG CCTCTACGAT 
GCGATGCACG GCCTGATCCC GCGGCTGGCG CCGCTGGTGC TCGACGTCTT CGGGCTGGCC 
GATGCGCTGC GCGACCTGGT CGAGCGCACC CGGGTCAGCC AGCCGCAGGC CAGCGTCGAA 
CTGCACATCG ACCTGGGCGA CGTGCAGCTG GGCAGCGAAG CGACGCTGGC GCTGTACCGT 
GCGGCCCAGG AGGGGTTGAC CAACGCGCTG CGCCACGGCC AGGCCAGGCA GCTGAGCGTC 
AGCCTGCATG CCGAGTCCGA AGGCGCCGAG CTGCAGGTCG ACGACGACGG CCAGGGCCTT 
GCGCCCGACT GGCGCGAGAA GGCGCGGCAG GACGGCGGCC ACTACGGCCT GCGCTGGCTG 
GCCGAGCGCG TGGAGGCGCT GGGCGGTGTG CTGCGCATCG ACAACCGCAG CCCGCGCGGT 
GTCGCCCTGC GGGTGTGGTT GCCGTTCACC GCGGCGGAGC CGGCGTGA

Protein sequence

MIFWNRRRAG GWPADTMRRM SLRLKIHLIV GVLVALCLVA VMALQVKSAR DAIREEIEAA 
NRVAAQLLQR TLWLQAARGT PAMIGYLQGV GRVRANDITL LDGKGELVYQ SPPSPYKSGR 
DAPDWFVDFM APPLEPQKMD FPDGTLVVRA DPSRAALDAW DQFAVLGLAA LGVLAVLNLV 
VFWVVGRTVE PFGQIVAALN RIEAGQLDVT LPRLPGTEAA AIGAAFNRMV VGVSERIEAE 
RRAAQAEHEL SDRRDLARWI DRHLEQERRL IARELHDELG QSVTGMRSLA LSVAQRVAIA 
DPEAARAAQV IADESSRLYD AMHGLIPRLA PLVLDVFGLA DALRDLVERT RVSQPQASVE 
LHIDLGDVQL GSEATLALYR AAQEGLTNAL RHGQARQLSV SLHAESEGAE LQVDDDGQGL 
APDWREKARQ DGGHYGLRWL AERVEALGGV LRIDNRSPRG VALRVWLPFT AAEPA