Gene M446_5584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_5584
Symbol
ID	6133327
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	6123549
End bp	6125309
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	65%
IMG OID	641645707
Product	signal transduction histidine kinase
Protein accession	YP_001772321
Protein GI	170743666
COG category	[T] Signal transduction mechanisms
COG ID	[COG3920] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGCCA TCGTGCCTGT TCAGCAGGCG TATGAGCCAG ATCCGCTCAG AGACCTCCTA 
AACGGCTTAC GGGACGGCTT CATCGCCCTC GATGAACGGT GGTGCTTCAC CGAGATGAAC 
CCGGCCGCGG AGACGCACTT CGGCCGCGGC CGCGAGAGCG CGCTCGGCGC ACCCATTCAA 
GACCTGATCC TCCCCTTCGC TGGAAGTGAG ATCGAGGCAC GCTGGCGGCA CGTGCTGGTC 
TCAGGTGAGC CGGCCCTCTT CGAGGCACCC TCGGCCGTGC GACCGGACCG CATCACTGAG 
TTCAACGTGT TTCGGTTCGG CGCGGGCCTG GGCGTCACAT TCCGAGACGT GACGGACGCT 
CGGCAGGCCG ACGCCGCTCT TCGAGAGAGC CAGTCCCGCC TAGAAATCGC TACGGAAGCG 
GCGCGGCTTG GTGTCTGGGA CTGGAACTTG CTCACCGACG AGATGGTCTA CTCGGAGCGA 
GCGTGTGCCA TCCACGGTCT CTCCCCGCAC GCTCCGGTCA CCCTGGACAT GCTGCGCGGC 
GCCACCCATC CCCAGGATCT GCCCCGTACC ACTGAGATGG CCGAGCGCGC CCTCGATCCG 
GCCATTCGGG AGCGCGTCCC CTATGAATAT CGCATCATCA GGCCCTCTGA CGACACGGTT 
CGTTGGGTGC TGGCACACGG CGAGGCCGTA TTTGCTCCTG TGGATGGCGT CGAACGAGCG 
GTCCGCTATG CTGGCACGCT TCAGGATATC ACCGCCCAAC TTGAGGCCGA GGAGGCCCTG 
CGCTCCAGCG AGGGCCGCCT CCGCCTCGCC CTAGACGCGG GTCGAATGGC CGTGTGGGCC 
TACGACGTCG CGACCGACTC GGTCCAGGGC TCAGCGGAAC TCAACCGCAT CTACGGCTTC 
CCGCCCGAGG CGTGTCCGAC GCTGGGTGAA TTCCGATCCC GCTACTATCC CGGTGACCGA 
GAGAGGCTGA CCGCCGCCTG GAGCGAGGCG CGAGCGCGCG ATGACCGCTA CTTCGAGGCA 
GAGCACCGAT GCGTGTGGCC GGACGGAAGC GTTCGGTGGC TGCTCCTGAG GGCCGAAACC 
AAGGAAGACA GTGCTGGGCA GCCGGCCAAC ATCGTCGGTG TGGTGCTGGA CATCACAGCG 
AGAAAGCGGG CCGAGGAGCA CCGAGCACTG CTCCTCCACG AACTGAACCA CCGCGTGAAG 
AACACCCTCG CCACCGTGCA GGCCATCGCC CATCAGACGT TCAGGGGAGA TTCCAGCGAC 
CGGACGGAGA CGTTCGAGGC GCGGCTGCTC GCCTTATCCA AGGCCCACGA CCTGCTCACG 
CGTGAGAGTT GGGAAGGGGC GAACCTGACT GAGATCGTGT CGGCAGCTAT TGCGCCTTTC 
CGCCGGACGG ACGGCACGCG CTTCCAGATC GTCGGCCGTC AGGTCTGGTT GGCACCGCGG 
ATTGCGCTGG CGCTCGCCAT GGCGCTGCAT GAGTTGGGTA CGAATGCGGC CAAGTATGGG 
GCGCTGTCCA CGATGAGCGG TCGCGTTCTG ATCGGCTGGT CTGTTTCCGG TTCGAAGCCC 
ACCCACCTCA TTCTGCGCTG GTCGGAACAG GGCGGTCCCT CGGTGGTGCC CCCGACACGC 
AAAGGGTTCG GTACGCGTCT GATCGAGCGC ACGTTAGCGA GCGAGATGCG GGGAGATGTG 
GACATCAGCT ACGAGCCGAC TGGTGTTGAG TGTGCCTTGG GGATCGCTCT CGATGATGAC 
GCGAGCAGTC CACCGGTTTA G

Protein sequence

MLAIVPVQQA YEPDPLRDLL NGLRDGFIAL DERWCFTEMN PAAETHFGRG RESALGAPIQ 
DLILPFAGSE IEARWRHVLV SGEPALFEAP SAVRPDRITE FNVFRFGAGL GVTFRDVTDA 
RQADAALRES QSRLEIATEA ARLGVWDWNL LTDEMVYSER ACAIHGLSPH APVTLDMLRG 
ATHPQDLPRT TEMAERALDP AIRERVPYEY RIIRPSDDTV RWVLAHGEAV FAPVDGVERA 
VRYAGTLQDI TAQLEAEEAL RSSEGRLRLA LDAGRMAVWA YDVATDSVQG SAELNRIYGF 
PPEACPTLGE FRSRYYPGDR ERLTAAWSEA RARDDRYFEA EHRCVWPDGS VRWLLLRAET 
KEDSAGQPAN IVGVVLDITA RKRAEEHRAL LLHELNHRVK NTLATVQAIA HQTFRGDSSD 
RTETFEARLL ALSKAHDLLT RESWEGANLT EIVSAAIAPF RRTDGTRFQI VGRQVWLAPR 
IALALAMALH ELGTNAAKYG ALSTMSGRVL IGWSVSGSKP THLILRWSEQ GGPSVVPPTR 
KGFGTRLIER TLASEMRGDV DISYEPTGVE CALGIALDDD ASSPPV