Gene Mext_4037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4037
Symbol
ID	5834365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	4492077
End bp	4493177
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	69%
IMG OID	641369828
Product	PAS sensor protein
Protein accession	YP_001641478
Protein GI	163853435
COG category	[T] Signal transduction mechanisms
COG ID	[COG3920] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.221223
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGGTT TTCCCAAAGG AGCGAGCCTG CCCTCGGGCG TCACGGTGGA GGTCTTCGCG 
GCAGCCTTCG AGGCCAGCCC GACGCCGATG GTGGTCACCG ATCCGCGGCG GGGCGACAAC 
CCGGTCGTCT GGGCCAACGG CGCCTTTCTC GGACTCACGG GCTATGCCCG CGAGGAACTC 
TACGGCCAGA ATTGCCGCAT GCTGCAAGGT CCCCTCACCG ATGCGGCGGT GCTTCAGACG 
ATGCGGGCGG CGCTCGCCAC AGGCCGGCCG TTCGAGGGCG AGCTGCTCAA TTACCGCAAG 
GACGGCACAT CGTTCTGGAA CGGAATGACG ATCAACCCGG TCTGCGACGA GGCGGGCAAG 
GTCCTGTTCT TCTTCTCGGC CCAGGCCGAC ATGACCGACA AGCACCGCCT GGAACTGGCG 
ATGCGCGACG CCAACGACGC GCTGGAGCGC GAGGTGAGCG AGCGCACCGC CGACCTGCGC 
TCGGCCCTGG AACAGAAGAC CGCGCTGCTC CACGAGGTCG ATCATCGGGT CAAGAACAAC 
CTCCAGGTCA TCTCCTCGCT GATGCTGCTG AAGGCCCGCC GCACGCCGGA GGGCGATGCC 
CGCAACGCGC TCCAGGCCAT GGCCGACCGG ATCGGCGCCC TCTCCACGGC CCACCGGATG 
CTGTACTCGG AGGGCGACGT GACCCGCTTC GACTTCCGGG AGTTCACCGC CGACCTGATC 
GCCGACCTCG CCGCCGGCCT CGACGGGGAC CGCACCCGGA TCGAGACGGA GATCGAGGCG 
CTGGCGCTCT CCGCCGCCAT GGCCGCCCCG CTGGCGCTGC TGATCCACGA ATTGACGACG 
AACGCCCTGC ACCACGCCTT CCCGGAGGCG CGCCGCGGCC GGGTCGCGAT TGAGGCACAC 
CGTTTCGAGG CGGGGATGCG CCTCGTCATT CAGGACGACG GCATCGGCAT GGCCGCGGTG 
CCGTCCAACC CCGCAGGCTT CGGCCGCACC CTGGTCGAGA TGGTGGTGCG CCAGTTGCGC 
GGCACCCTCG AATGGTCGGA TGCCGGGCCC GGCACCCGGA TCACGATCAC GATCCCGCTG 
GTCGGGACCG ACGCATTGTG A

Protein sequence

MTGFPKGASL PSGVTVEVFA AAFEASPTPM VVTDPRRGDN PVVWANGAFL GLTGYAREEL 
YGQNCRMLQG PLTDAAVLQT MRAALATGRP FEGELLNYRK DGTSFWNGMT INPVCDEAGK 
VLFFFSAQAD MTDKHRLELA MRDANDALER EVSERTADLR SALEQKTALL HEVDHRVKNN 
LQVISSLMLL KARRTPEGDA RNALQAMADR IGALSTAHRM LYSEGDVTRF DFREFTADLI 
ADLAAGLDGD RTRIETEIEA LALSAAMAAP LALLIHELTT NALHHAFPEA RRGRVAIEAH 
RFEAGMRLVI QDDGIGMAAV PSNPAGFGRT LVEMVVRQLR GTLEWSDAGP GTRITITIPL 
VGTDAL