Gene Mpe_A1168 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1168
Symbol
ID	4785567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	1250384
End bp	1252441
Gene Length	2058 bp
Protein Length	685 aa
Translation table	11
GC content	72%
IMG OID	640089731
Product	sensor histidine kinase
Protein accession	YP_001020364
Protein GI	124266360
COG category	[T] Signal transduction mechanisms
COG ID	[COG4191] Signal transduction histidine kinase regulating C4-dicarboxylate transport system
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.527437
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTTCT ACGAGCGCTT CCAGCGGCTG CCGATCCGCA GCAAGCTGCT GGCGATGGTG 
CTGCTGCCGT TGGTGGTGGT GCTGCCGCTG CTGGGCCTGC TGCTGCTGGT CTGGGGCAAC 
GTGGCGCTGG ACCGCCTGCT GATCACCAAG GTGCGCAGCG ACCTGGCGGT GGCCCAGGGC 
TACTTCGAGC GCGTGCTCGG CGAGGTGGGC AGCAGCGCCG CCGCCGTGGC CGACTCGCAG 
GCACTGCACC GTGCGCTGGA CGACGACACG GCGGCGACGT CGGCCGACGC GGGGACGTGG 
GTGACGCTGC TGCAGGCGTT CAAGGCCCGC GAAGGCCTCG ATTTCATCAA CTTGCGCGCC 
CCCGACGGGA CGTTGCGCAT CACCGACTTC GGCGCGGCCC CGGCCACCGA CGGGCGCTCG 
CCGGCGTTCC GTGCGGCGGC GGCCGAAAGC GGCCGGGCAC GCGCCAGCAT CGAGGTGCTG 
CAGCCCGACG AACTGGCGCG TCTCGCGCCG GCGCTGCAGG ACCGCGTCGC GGTGCCGCTG 
GTGAGCACGC GCAACGCCGC GCCCACGGCT CGCACGCAGG AAGACCGCGC GATGGTCGTG 
CTGGCCACCG CGCCGGTGCA CGACGAACGC GGCGTGCTGC GCGGCCACGT GCAGGCCGGC 
GTGCTGCTGA ACCGCAACCT GCCCTTCATC GACCACATCA ACGAGATCGT CTACCCCGAA 
GGCGCGCTGC CCTTCGGCAG CCGCGGCACC GCGACGCTGT TCCTCGACGA CGTGCGCATC 
AGCACCAACG TGCGGCTGTT CGGCGACGAT CCCAAGAACC GCGCCATCGG CACCCGCGTG 
TCGCAGGCGG TACGCGACAC CGTGCTCGGC GGCGGTCAGC CGTGGCTGGA CCGCGCCTTC 
GTCGTCAACG ACTGGTACGT CTCGGGCTAC CTGCCGCTGG CCGACGGCGC CGGCCGGCGC 
GTCGGCATGC TCTACGTCGG CTACCTGGAA CGGCCCTTCA CCTGGCTGAA GTACGCCGTG 
CTGCTGAGCA TCGGCGCGAT CTTCTTCGCC GTGATGATCG GCGCCACCGT GGTGTCGCTG 
CGCTGGGCGC GCAGCATCTT CAAGCCGCTG GAGCAGATGG CGCGCACGAT GCAGCAGGTC 
GAGGCCGGTG GGCTCGACGC GCGCGTCGGC GCGGCCGGCC ACCACCCCGA CGAGATCGGC 
CGGCTCGCCG CCCACCTGGA CCACCTGCTC GACGTGATCG ACGACAAGAC GCGCGCGCTG 
CAGCGCTGGG GCGACGAGCT CGACCGCAAG GTGGTCGAGC GCACGCGCGA CCTGGAGCAG 
GCGCAGGCGC AGCTGCTGCG CTCGGAGAAG CTGGCCACCG TGGGCCAGCT CACCGCCAGC 
ATCGCGCACG AGGTCAACAA CCCGATCGCG GTGATCCAGG GCAACCTCGA CCTGCTCCGC 
GAGCTGCTCG GGCCGCAGAC CGCCGCCAAG GTCGACGCCG AGCTGCGGCT GGTGGACGAG 
CAGATCGAGC GCATGCGGCT GATCGTCACG CAACTTCTGC AGTTCGCGCG CCCGAACGAA 
TACGCCGGCT ACGTGGACAG CGTGAGCGTG GCGCGCGCGC TCGACGACTC GCTGCTGCTG 
GTCGGGCCTC AGCTCGCGCG CACCCGGATC GCGGTGCAGC GCGACGACCG GGCGACGGCC 
AGTGCCGCCA TCAACCGCCA GGAGCTGCAG CAGGTGCTGC TCAACCTGCT GATCAACGCG 
CTGCACGCGA TGCCCGACAG CGGCACGCTG TCGCTGCACA CACGCGACTG GCACGCCGCC 
GACGGCCGCG TGCAGGGCGT GCAGATCGAC GTGGCCGACA GCGGCCCCGG GCTGGGACCG 
GAGATCGAGT CGCGGCTGTT TCAGCCCTTC GTCACCACCA AGACCGACGG CACCGGCCTG 
GGCCTGTGGA TCAGCCGCAG CCTGATCGAG CGCTACGGCG GCACGCTGAC CGCGGCCAAC 
CGCGACGACG GCGCGCGCGG CGCGGTGTTC AGCGTGCGGC TCTACAGCGA ACTGCCGGAG 
ACGACGCTGC CGGCCTGA

Protein sequence

MTFYERFQRL PIRSKLLAMV LLPLVVVLPL LGLLLLVWGN VALDRLLITK VRSDLAVAQG 
YFERVLGEVG SSAAAVADSQ ALHRALDDDT AATSADAGTW VTLLQAFKAR EGLDFINLRA 
PDGTLRITDF GAAPATDGRS PAFRAAAAES GRARASIEVL QPDELARLAP ALQDRVAVPL 
VSTRNAAPTA RTQEDRAMVV LATAPVHDER GVLRGHVQAG VLLNRNLPFI DHINEIVYPE 
GALPFGSRGT ATLFLDDVRI STNVRLFGDD PKNRAIGTRV SQAVRDTVLG GGQPWLDRAF 
VVNDWYVSGY LPLADGAGRR VGMLYVGYLE RPFTWLKYAV LLSIGAIFFA VMIGATVVSL 
RWARSIFKPL EQMARTMQQV EAGGLDARVG AAGHHPDEIG RLAAHLDHLL DVIDDKTRAL 
QRWGDELDRK VVERTRDLEQ AQAQLLRSEK LATVGQLTAS IAHEVNNPIA VIQGNLDLLR 
ELLGPQTAAK VDAELRLVDE QIERMRLIVT QLLQFARPNE YAGYVDSVSV ARALDDSLLL 
VGPQLARTRI AVQRDDRATA SAAINRQELQ QVLLNLLINA LHAMPDSGTL SLHTRDWHAA 
DGRVQGVQID VADSGPGLGP EIESRLFQPF VTTKTDGTGL GLWISRSLIE RYGGTLTAAN 
RDDGARGAVF SVRLYSELPE TTLPA