Gene Mext_3663 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3663
Symbol
ID	5832093
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	4050971
End bp	4052083
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	68%
IMG OID	641369456
Product	alkanesulfonate monooxygenase
Protein accession	YP_001641112
Protein GI	163853069
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGTTC CGAACTCGTC CTCCGCGTCC GAGCCGATCC GCTTCGCCTA CTGGGTGCCC 
AATGTCTCGG GCGGCCTCGT CATCAGCAAG ATCGCGCAGC GCACGAGCTG GGACGCGGAC 
TATAACCGCA AGCTCGCGCA GATCGCGGAG GCGGCGGGCT TCGACTACGC CCTGACCCAG 
ATCCGCTTCA CCGCCGGCTA CGGCGCCGAG TACCAGCACG AATCGGTCGC CTTCAGCCAC 
GCGCTCGCCG CCGCCACGAC CCGGCTGACG GTGATCGCCG CGATCCTGCC CGGCCCCTGG 
AACCCGACGC TCGCGGCCAA GCAGATCGCC ACGATCTCCC AGCTCACGGA AGGACGGATC 
GCGATCAACA TCGTCTCGGG CTGGTTCTCC GGCGAGTTCC GGGCGATCGG CGAGCCCTGG 
CTCGACCACG ACGAGCGCTA CCGCCGCTCG GAGGAGTTCA TCCGGTCCTT GCGCGGGATC 
TGGACGCAGG ACGCCTTCAG CTTCCGCGGC GATTTCTATC GCTACACGAA CTACACCCTG 
AAGCCGAAGC CGGGGCCGAA CCTGCCGGAG ATCTTCCAGG GCGGCTCCTC GCGCGCCGCC 
CGCGACATGG CCGCCCGCGT CTCCGATTGG TACTTCACCA ACGGCAACAC GCCCGACGGC 
GTGCGGGCGC AGGTCGAGGA TCTGCGCGCC AAGGCGCAGG CGAACGGCCA TTCGGTGAAG 
GTCGGCGTCA ACGCCTTCGT CATCGCCCGC GAGACGGAGG AGGAGGCCCG CGCCGTCCTT 
CAGGAGATCA TCGAGAACGC CGATCCGGAC GCGGTGAAGG CCTTCGGCCA CGAGGTGAAG 
AACGCCGGCG CGGCCTCGCC CGAAGGCGAG GGCAACTGGG CGAAATCGAC CTTCGAGGAT 
CTCGTCCAGT ACAACGACGG CTTCAAGACC AACCTGATCG GCACGCCCGA CCAGATCGCC 
GAGCGCATCC TCGCCCTCAA GGATGCTGGC GTCGATCTCG CCCTGCTCGC CTTCCTGCAC 
TTCCAGGAAG AGGTGCAGTA TTTCGGCGAG CACGTGATCC CGCGGGTCCG CGCGCTGGAA 
GCCGCCCGCG AGCGCCGGGC CGAGGCGGCC TGA

Protein sequence

MSVPNSSSAS EPIRFAYWVP NVSGGLVISK IAQRTSWDAD YNRKLAQIAE AAGFDYALTQ 
IRFTAGYGAE YQHESVAFSH ALAAATTRLT VIAAILPGPW NPTLAAKQIA TISQLTEGRI 
AINIVSGWFS GEFRAIGEPW LDHDERYRRS EEFIRSLRGI WTQDAFSFRG DFYRYTNYTL 
KPKPGPNLPE IFQGGSSRAA RDMAARVSDW YFTNGNTPDG VRAQVEDLRA KAQANGHSVK 
VGVNAFVIAR ETEEEARAVL QEIIENADPD AVKAFGHEVK NAGAASPEGE GNWAKSTFED 
LVQYNDGFKT NLIGTPDQIA ERILALKDAG VDLALLAFLH FQEEVQYFGE HVIPRVRALE 
AARERRAEAA