Gene Mext_4526 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4526
Symbol
ID	5834739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	5055741
End bp	5056886
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	68%
IMG OID	641370320
Product	histidine kinase dimerisation/phosphoacceptor
Protein accession	YP_001641965
Protein GI	163853922
COG category	[T] Signal transduction mechanisms
COG ID	[COG3920] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.315667
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAGA TCTCACCGGA GGTTCTGGAC CTCCGGTTGC GCCAGCAGGC GATCCTGTCC 
GATTTCGGCG TCGAGGCCCT GCGCGCAACC GAACTGCTGC CGCTGCTGCA GCGGGCGACA 
GAACTCTGCG CCGAGGGCAT GAACGCGCAG TTCTGCAAGG CACTCGAATA TCAGCCGACG 
CAGGACATGC TCCTCGTCTG CGCCGGCATC GGCTGGGAGC CGGATTGTAT CGGGCGCGCC 
GTCGTCGGCG CCGACCTCGC CTCGCCCGCG GGCTACGCCC TGAAGACCGG CCGCCCCGTT 
ATCTCCAACC ATCTGGAGAA CGAGACCCGC TTCCGCACGC CGGAACTGAT GGCAAGCCAC 
GGCATCCGCC GGGCGGTGAA CGTGCTCATC ACCAACCGCG AGGGGCATTA CGGCGTCCTG 
GAGGTGGACG ACACCCGCGA GGGCATGTTC GGCCCCGCCG ACATCGCCTT CATGCAGGGC 
TTCGCCAACC TGCTCGGCAG CGCGATTGAG CGTCAGCGCT CGGAGGCGCA GCTCAAGGTC 
GCCCTGGAGC GGCAGGACCT GCTGAGCCGC GAGATGAGCC ATCGGGTCAA GAATAGCCTC 
GCCGTCGTGG CGGGGCTTCT CGCGCTCCAG GCGCGCGGCA CCGACAACGA GGATGTGAAA 
AGCGCTCTCG CCGACGCGCG CGCCCGCGTC GAGGCGGTGG CGCAGGTCCA CGACCAGCTC 
TGGCGTCAGC CGGATCTCAC GCGCATCGAC GTCGCCGGCT TCCTTGAAGC CCTATGCGAG 
AAGCTCACGG AGACGGCGGG CGCTCATGCT TTGGTCTGCC GCGCGGCAGC CGTGACCATG 
CCGGCCGATC TCGCGATTCC GCTCGGCCTG TTCGTGAACG AACTCGTCAC CAACGCCATC 
AAATACGCCT ATCCCGACGG ACACGGCGAG ATTCGCGTCG AAGCCGTCAT GCGCGAGGAT 
GGCGGGCTCA CTGTCTCGGT CTGCGACGAC GGCATCGGCC TGCCGCCGGG CTTCGACCCG 
TTGAAAACCC GTGCGAGCCT TGGGATGCGC GTCGTCGGCA ATCTGTCCCG ACAACTCGAC 
GGCACACTGA CGCTGAAGCC GGGCAAGGGC GCCCAGTTCG AGCTGCGGAT GGCGCCGCGC 
GGGTAA

Protein sequence

MTEISPEVLD LRLRQQAILS DFGVEALRAT ELLPLLQRAT ELCAEGMNAQ FCKALEYQPT 
QDMLLVCAGI GWEPDCIGRA VVGADLASPA GYALKTGRPV ISNHLENETR FRTPELMASH 
GIRRAVNVLI TNREGHYGVL EVDDTREGMF GPADIAFMQG FANLLGSAIE RQRSEAQLKV 
ALERQDLLSR EMSHRVKNSL AVVAGLLALQ ARGTDNEDVK SALADARARV EAVAQVHDQL 
WRQPDLTRID VAGFLEALCE KLTETAGAHA LVCRAAAVTM PADLAIPLGL FVNELVTNAI 
KYAYPDGHGE IRVEAVMRED GGLTVSVCDD GIGLPPGFDP LKTRASLGMR VVGNLSRQLD 
GTLTLKPGKG AQFELRMAPR G