Gene Mext_3342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3342
Symbol
ID	5834575
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	3705614
End bp	3706660
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	72%
IMG OID	641369142
Product	alkanesulfonate monooxygenase
Protein accession	YP_001640800
Protein GI	163852757
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCACC CGCTCCGCTT CGGCGTCTGG GCGCCGGTCC ACGGCTCCCG CGCCGCCCGC 
CACGATCCGG ACGAGCCGCA CGACGCCTCC TGGGCGCGCA ACCGCGCCCT CGTGCTCGAG 
GCCGAGCGCC TCGGCTACGA TTCCGTCCTC GTCGCCCAGC ACACGGTGAA CCCCTACGAC 
GAGACCCGCG ACCAGCTGGA GGCCTGGACC GCCTCGGCCG CGCTGGCGGC GCTCACCGAG 
CGGATCGAGA TCATCGCGGC GATCAAGCCG GGGCTCTACC ACCCGGTGTT GCTCGCCAAG 
ATGGCGCTGC AGATCGAGCA GGTCAGCCGG GGGCGCTTCG CCCTCAATCT CGTCAACGCC 
TGGAACCGCG CCGAATTCGA GCGGGCCGGC CTGCCGTTCC CGGCCCATGA CGAGCGCTAC 
GCCTATGGCC GCGAATGGAT CGCCCTGGTC GACCGGCTGC TGCGGGGCGA GCGCGTCACC 
CATGAGGGCC GGCACTTCCG CGTCGAGGAT TACCAGCTCA AGCCCGCGGG CACCTATCGG 
GCGCGGCCGG CGATCTATGT CGGCGGCGAG TCCAAGCCGG CCCGCGCGCT GGTGGCCGAT 
CACGGCGACG TCTGGTTCAT CAACGGCCAG CCGCTGGCCG CGGTCGCCGA TCTCATCGCC 
GACGTCGCCC GGCGCCCGGC CGCTCAAGGC CGTCTGCGCT ACGGGCTCTC GGCCTTCGTG 
ATCGCGCGGG AGACGGAAGC CGAGGCGCAG GACGAATTCG CCCGGCTTCT GAGCTTGAGC 
CGCCGCGACG AGGCCATTCG CGCCGACACC CGGGCGCGCA CGGACGCGGC GAGCGTGATG 
TTCGCCAAGA CCGATGCGGC GGCCGCGCAC CATGTCGGCA CCAACGGCGG CACGGCGGCC 
GGTCTCGTCG GCAGCTACGA TGGGGTGGCC GAGCGCATCC GCGCCTTCCA CGCGGCGGGG 
ATCGAGCTGT TCATGCTGCA ATTCCAGCCG TTCGAGGCGG AGATGGCCCG CTTCGCCGCG 
AAGGTGTTTT CGCGGGTGAA GGGATGA

Protein sequence

MSHPLRFGVW APVHGSRAAR HDPDEPHDAS WARNRALVLE AERLGYDSVL VAQHTVNPYD 
ETRDQLEAWT ASAALAALTE RIEIIAAIKP GLYHPVLLAK MALQIEQVSR GRFALNLVNA 
WNRAEFERAG LPFPAHDERY AYGREWIALV DRLLRGERVT HEGRHFRVED YQLKPAGTYR 
ARPAIYVGGE SKPARALVAD HGDVWFINGQ PLAAVADLIA DVARRPAAQG RLRYGLSAFV 
IARETEAEAQ DEFARLLSLS RRDEAIRADT RARTDAASVM FAKTDAAAAH HVGTNGGTAA 
GLVGSYDGVA ERIRAFHAAG IELFMLQFQP FEAEMARFAA KVFSRVKG