Gene Mext_1117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1117
Symbol
ID	5833351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	1218711
End bp	1220213
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	63%
IMG OID	641366912
Product	PAS sensor protein
Protein accession	YP_001638592
Protein GI	163850549
COG category	[T] Signal transduction mechanisms
COG ID	[COG3920] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGATC TGGAGGAAAC AGCTCGTTCT AACGCACTGG GCCGCTACGC GATCTTGGAC 
ACGGCTCCAG AGCCGGCCTT CGACGACCTT GTGCTCCTCG CCTCGCGGAT CTGCGAGGCG 
CCTGTCGCAC TCATCAGCCT TGTTGGATCA GATCGGCAGT GGTTCAAGGC ACGCATCGGC 
CTTGCCCCTT CCGAAATGCC CATCGAGCAA TCGGTCTGCC GTCATGCTTT GAAGCAGGCC 
GGACTCTTCG TGATCCCGGA CCTGACGCTC GATCCGCGGA CCTCCCGCAA CCCTCTCGTC 
ACGGGCGAAC CTCACATCCG GTTCTACGCC GGAGCACAAC TGGTGACCTC GGACGGTGTC 
GCTTTCGGCA CGATCTGTGT CATCGACACC AAGCCGCGGC CGGAAGGCCT CACGGATAAC 
CAGGCCAGCA GCCTTGAGGC GCTCGCCCGG CAGGCCATGT CACAGATGGA GCTCCGTCGC 
GTGATCGCCG AGCGCGCTGA GACGGCGCTG CGCAGGAGCG AGGAACGGTT CCAGGCTTTG 
GCCAACCTTG TTCCGGGCTT TCTCTGGAGC AGTGATCTTG TCGGTCGAGC AACGTGGTTC 
AGCGAGCGCT GGTACGAGTA CTCCGGCCAA TCTGAACCGG AGGCTCTCGG CTATGGCTGG 
CAGACGGTGA TCCATCCAGA CGAGCGCGAG TACACAATCA CGGGCTTCCG GGCCGCCATG 
GATCAGGAAC GTCCGTATAA CCGTGAATAC CGCATTCGCG GGAAGGATGG CATCTACCGC 
TGGTTCATGG TGCGTGCTGA GCCGATACGG GATGCCGCTG GGCAGATCGA TCGCTGCTAC 
GGAGCGGTCA CGGACATCCA CGATCTGCAT GAGATGCAGC AGCGTCAAGC GGTGTTGGTG 
GATGAGCTGC AGCACCGTAC CCGCAATCTG CTCGCCGTGG TGCGCTCGAT CGCGCAGCAA 
ACGATGACCC AGACCGGTTC GACCGAACAG TTTTGCGACC GGTTCAACGA CCGTCTCGCG 
GCGCTCTCAC GGGTGCAGGG TCTGCTCTCA CGTTCCGACA AGGAGCCGAT CACCATCCAG 
GCGTTGATCC AGATCGAGCT CGACGCGTTC GGGGTTGCCG CGATGCAGGC TCGAGTGGCG 
CTGAAGGGCC CGCCGGTTCG CTTGCGCAAG GTCAGCGTGC AGACACTCGC TCTCGCCCTG 
CACGAGTTGG CCACCAATGC GCGCAAGTAC GGCTCTCTCG CCAACGAGCA GGGGAGGCTC 
TGGGTGAGCT GGGATACCTA CAGGGGAGAG GACGAAGAGC GGCGGCTATC GCTGGTTTGG 
CAGGAAGAGG GTATCCGCCG GCCCCAGGAA GGCAGTCCGA TCCGGCGGGG CTATGGGCGT 
GACCTGATCG AGAAGGCGCT GCCCTACGCA CTGAAGGCCC GCACCAGCTA CGAACTCAGT 
GAGGCTGAGC TGCGCTGTGT CATCGACCTA CCGCTCACCG ATGGCGCGAA GAAACGGCCT 
TGA

Protein sequence

MPDLEETARS NALGRYAILD TAPEPAFDDL VLLASRICEA PVALISLVGS DRQWFKARIG 
LAPSEMPIEQ SVCRHALKQA GLFVIPDLTL DPRTSRNPLV TGEPHIRFYA GAQLVTSDGV 
AFGTICVIDT KPRPEGLTDN QASSLEALAR QAMSQMELRR VIAERAETAL RRSEERFQAL 
ANLVPGFLWS SDLVGRATWF SERWYEYSGQ SEPEALGYGW QTVIHPDERE YTITGFRAAM 
DQERPYNREY RIRGKDGIYR WFMVRAEPIR DAAGQIDRCY GAVTDIHDLH EMQQRQAVLV 
DELQHRTRNL LAVVRSIAQQ TMTQTGSTEQ FCDRFNDRLA ALSRVQGLLS RSDKEPITIQ 
ALIQIELDAF GVAAMQARVA LKGPPVRLRK VSVQTLALAL HELATNARKY GSLANEQGRL 
WVSWDTYRGE DEERRLSLVW QEEGIRRPQE GSPIRRGYGR DLIEKALPYA LKARTSYELS 
EAELRCVIDL PLTDGAKKRP