Gene Mchl_5002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mchl_5002
Symbol
ID	7115000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium chloromethanicum CM4
Kingdom	Bacteria
Replicon accession	NC_011757
Strand	+
Start bp	5347715
End bp	5351005
Gene Length	3291 bp
Protein Length	1096 aa
Translation table	11
GC content	68%
IMG OID	643527696
Product	signal transduction histidine kinase
Protein accession	YP_002423695
Protein GI	218532879
COG category	[T] Signal transduction mechanisms
COG ID	[COG3920] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGCGC GTATTCGTGC CTACGATTGG GCACGGACAC CTCTTGGCGC CATTGCTGAT 
TGGCCGCAGA GTTTGAGGAC GATGGTCGAG TTGATGCTCG GCTCTCCTTT GCCGGCCGCG 
ATCGCCTGGG GTCCTGAACT TACGGTAATC TATAACGACG GTTTCGACGC GATCGACAAC 
TTCAGCGATC CGCCGCCCCT TGGCCGACCG TTCACGAAAG TCTGGCCAAA GCCGGAAAGC 
GACGAAATCG TCCACTCGAT ACGACAGGGG CAGGCCCGTC AGATCATTGA TCGCTACTGG 
GATCTTCCCG CGCGGCCGGA GCGACCTTTC GGCTGGTTCA CGTCCCAGTG GACGCCGTTG 
CGGGACGAAG CGGGAGGCTT CGCCGGGTTC TATCTCGCGG CCTTCGAGAC GACCGATCGC 
GTCCTCGTCG AGCGGGCTTT GCTCGAGCGC GAGGAGCAGC AGGCCTTCGT GCTCGGCCTC 
AGCGACGCGC TGCGCCCCCT GGCCGATCCG CTCGAAGTCC AGGCCGTGGC CTGCCGCTTG 
CTCGGCGAGC ACCTTCAAGC GGACTACACG TACTACCTCA ACCTGTACGA GGCGGAGGGT 
TTCGCGATCA TCGCACAGGA TTTCGCGCGC GCGGGTCTCC CCTCGCGGGC CGGGAAATAT 
CCCCTCAGCC TCGTCGGTTG GGCGATGCCC CATCAGGGCC AGGGCCAGCC GATCGCGATC 
ACGGACGTGC AGACATCCCC CCTGGTCCCG GACGACTGCC GGGAGAGGGT GCTGGCCGAC 
CGTGTCGTGA GCCTGCTCGG CATTCCGCTG GCGAAGCAAG GCCGCCTCGT CGGCGCACTT 
GCGCTCTCCA TGACGACGCC GCGAGAATGG ACCCCCGCGG AGATCGCGCT GGCCACCGAG 
ATCGGCGAGC GCACCTGGGC GGCGATGGAG CGGGCGCGCG CGGAGAAGAC GGCGCGCGAG 
GCCGACATTC GCCTGCGCAC CCTGGCCGAT GCCGCACCCG TCCTGATCTG GGACGCGGAT 
TCGAGCGGCA CGATCCTCGT CAATGACCAC TATCTCGACT TCTTCGGTGT CGGCTTCGAG 
GCCGTGGCGG GGTATGGCTG GCAGAAGTTC CTGCATCCCG AGGATGCCGA GCGACACCTT 
TCTCTCTTCC AAGAGGCGTT CGCGCAGCGC CGTTGCTTCA CCGACGAGGC GCGGCTCCGC 
CGTGCCGACG GGCAGTACCG CTGGCTCAGC ACGTCCGGCC GCCCGCTGGA GGACGGACGC 
TTCGTTGGCG TCTCGATCGA CGTCACCGAG CGGCGCCTCG CCGAGCAGCG CGTCAGGCGC 
AACAACGCCG TCCTCCAAGC GATCAACCTC GTCTTCAGCG AGACGCTCGG CGCCTCCTCA 
GAGGAGGAAT TGGCGCGCAT CTCCCTCGAA GTCGCCGAAG AGCTGACCGG CAGCGCCATT 
GGCTTCATCG GTGAGATCAA TGAGACCACC GGGCGCCTCG ACGGCCTGTT CTTCAGCGAC 
CGGAGCCGTG CCCGCTACGC CGCGCACGCA TCGGAGGGGG GTGACGGCTT CCCGATGGGC 
AAGTCGGCGC TGGGGCTTGC GATTCACGGC ATCTACGGGC GGGTGTTGCA GGATGGCGCG 
GGCGTCATCG TCAACGATCC CGCCTCCCAC CCCGACCGCG TCGGCACGCC GGCCGGCCAC 
CTGCCGCTGA CGGCCTTCCT CGGCGTGCCG CTGAAGCAGG GTGACAGGAC GCGGGGCCTG 
ATCGGGCTCG GCAACCGCCC GGGCGGCTAC CGGCCGGAGG ACCTTGAGGC GGCGGAGGCG 
CTGGCGCCCG CGATCTGGCA CGCCCTGCGC AGCAAGCGGG CGGAACTGCG CCTGCGCGAG 
AGCGAGGAGC GTTTCCGGCA ATTCGCCGAG GCCTCCTCCG ACGTCCTGTG GATCCGCGAT 
GCGGAGACGT TCGAGATGGA GTTCGTCAGC CCGGCGCTGC GGACGGTCTA CGGCATCGAA 
CCCAACGTGC TCGGCCCCGA GATCCGGCGG TGGGCCGGCC ATATGCTGCC GGAGGATCGC 
GAGAACGCCC TGCAAAACCT GCAGCGGGCG GCGACCGGCC AATCGCTGCT GAACGAGTTC 
CGCATCAAGC GGCCGAGCGA CGGCGCCTTC CGCTGGATCC GCAGCACGCT GTTCCCCTTG 
CGCGACGAGC AGGGCCGGGT GCGGCGCATC GGCGGTCTGT CCTCCGACAT GACCGAGGCC 
AAGCTGCTGA TCGGGCATCA GGCCGTGCTG CTCGCCGAAT TGCAGCACAG GGTGCGCAAC 
ATCATGGCGG TGACCCGCTC GATCGTCGCC CGCACGGGCG AGCGGGCGGA GACCGTGTCC 
GATTACGCGT CCCTGGTGGG AGGGCGCCTC CTGACGCTGG CCCGCGTCCA GGCCCTGCTG 
ACCCGCTCGC CCAATGCCGG CGTGCCGGTC GCCACCATCG TCCGCGACGA GATCGACGCC 
CAGGATCTGC GCGCGGACCA GTACGATCTG TCGGGACCCA AAATCGAACT CTCGCCCAAG 
GCGGCGGAGA TCCTGACGCT CGCCGTTCAC GAACTGGCGA CCAATGCCCT GAAATATGGA 
GCCTTGTCGG TGCCGGATGG GCGCGTGCGG GTGAACTGGT CCTCGTTCGA GAAGAGAGGC 
GAGCCCTGGC TCGGCTTCGA TTGGGCGGAG GATGGCGTGC CGGAAGCGAA GATTGCGGAC 
GAGCGTGAGG CGAATTGCCG CACCGGCGCG CGCCGTGGTT TCGGCCGCGA ACTGATCGAG 
GGGCGCCTGC CTTACGAACT CGGGGGGCGC GGTCGCCTGG AGATCGGCCC GGAGGGGGCG 
CGGTGCCGCC TCGAATTTCC GCTCCGCGAT GGCGCCAGCA TTCTTGAAAC CGATGCCCCG 
CAACGAGCGA CCGTGTTCGG AGGAGCGCTC GACATGACCG GCGAACCAGA TTTGAGCGGC 
TATCGCATCC TCGTGGTGGA GGACGATTAC TATCTCGCCA CCGATACGGC ACGCGCGCTC 
CAGGGAGCGG GCGCGGAGGT GGTCGGCCCC TGCCCCAGCG AGGAGACGGC GCGCGAGGCG 
CTCGACGGAG GGGCGCTGGC AGCGGCGCTG GTGGATATCA ATCTCGGCTC AGGGCCGTCC 
TTCACCCTGG CGGCCCTGCT TCGGGAGCGC GGCGTGCCGT TCGTGTTCAT CACCGGTTAC 
GACGAGGGGG TGATTCCGCC GGATTTCGCC GATGTGGAGC GCCTCCAGAA GCCGGTCGAG 
CTGAAACGCG TCGTCAATTT CCTCGCCGAC ACGCTGCAAG CGGCGCAGTG A

Protein sequence

MSARIRAYDW ARTPLGAIAD WPQSLRTMVE LMLGSPLPAA IAWGPELTVI YNDGFDAIDN 
FSDPPPLGRP FTKVWPKPES DEIVHSIRQG QARQIIDRYW DLPARPERPF GWFTSQWTPL 
RDEAGGFAGF YLAAFETTDR VLVERALLER EEQQAFVLGL SDALRPLADP LEVQAVACRL 
LGEHLQADYT YYLNLYEAEG FAIIAQDFAR AGLPSRAGKY PLSLVGWAMP HQGQGQPIAI 
TDVQTSPLVP DDCRERVLAD RVVSLLGIPL AKQGRLVGAL ALSMTTPREW TPAEIALATE 
IGERTWAAME RARAEKTARE ADIRLRTLAD AAPVLIWDAD SSGTILVNDH YLDFFGVGFE 
AVAGYGWQKF LHPEDAERHL SLFQEAFAQR RCFTDEARLR RADGQYRWLS TSGRPLEDGR 
FVGVSIDVTE RRLAEQRVRR NNAVLQAINL VFSETLGASS EEELARISLE VAEELTGSAI 
GFIGEINETT GRLDGLFFSD RSRARYAAHA SEGGDGFPMG KSALGLAIHG IYGRVLQDGA 
GVIVNDPASH PDRVGTPAGH LPLTAFLGVP LKQGDRTRGL IGLGNRPGGY RPEDLEAAEA 
LAPAIWHALR SKRAELRLRE SEERFRQFAE ASSDVLWIRD AETFEMEFVS PALRTVYGIE 
PNVLGPEIRR WAGHMLPEDR ENALQNLQRA ATGQSLLNEF RIKRPSDGAF RWIRSTLFPL 
RDEQGRVRRI GGLSSDMTEA KLLIGHQAVL LAELQHRVRN IMAVTRSIVA RTGERAETVS 
DYASLVGGRL LTLARVQALL TRSPNAGVPV ATIVRDEIDA QDLRADQYDL SGPKIELSPK 
AAEILTLAVH ELATNALKYG ALSVPDGRVR VNWSSFEKRG EPWLGFDWAE DGVPEAKIAD 
EREANCRTGA RRGFGRELIE GRLPYELGGR GRLEIGPEGA RCRLEFPLRD GASILETDAP 
QRATVFGGAL DMTGEPDLSG YRILVVEDDY YLATDTARAL QGAGAEVVGP CPSEETAREA 
LDGGALAAAL VDINLGSGPS FTLAALLRER GVPFVFITGY DEGVIPPDFA DVERLQKPVE 
LKRVVNFLAD TLQAAQ