Gene Mext_3339 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3339
Symbol
ID	5833484
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	3702849
End bp	3704069
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	73%
IMG OID	641369139
Product	oxidoreductase molybdopterin binding
Protein accession	YP_001640797
Protein GI	163852754
COG category	[R] General function prediction only
COG ID	[COG2041] Sulfite oxidase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.617225
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAGGG TCATGGAAAA CCGCCGCGCC TTCCTGCGCC TGGCCGGCTC GCTTGCCGGG 
GCGGGCGCCG CCACCGGAGC CCTGGCGGAG GCGGGCTCCC TCGACGTGCC GCCCTGGACC 
CGCGAGCAGG GCGCCACCGC TCCGGGCTAT GGCCGGCCCG GCCCGCGGGA GACGCTTGCG 
CGCTATCCCC GGCTGCCGCC GCCCTTTCCC GGGGCGGTGG CCACGGTGAC GCCGCTCCAG 
GGCCTGCACG GCATTCTCAC GCCCAACGGC CTGCATTACG AGCGCCACCA CGCCGGCATC 
CCGGCGATCG ATCCGGACCG GCACCGCCTC GTGGTGCACG GCCTCGTCGC GCGCCCACTG 
ATCCTCACCA TGGACGACAT CCTCCGCTTC CCCGCGGTCT CGCGGCTGCA TTTCCTCGAA 
TGTTCGGGCA ACACGCCCTG GCTCGGGGCG AAGCCCGACT GGACGGTGCA GGACAGCCAC 
GGCCTGATCT CCTGCGCCGA GTGGACCGGC GTCGAACTCT CGACCCTGCT CGCCGAGGTC 
GGCGTGCAGC CGGGCGCCGC CTGGATCCTG GCGGAGGGGG CGGATGCCTG CGCCATGACC 
CGCTCGATCC CCCTCGACGC GCTCGACGGG GCGATCCTCG CCTACGCGCA GAACGGCGAG 
CGGCTGCGGC CGGAGCAGGG CTATCCCCTG CGGCTGTTCC TGCCGGGGCT GGAGGGCAAC 
CTCAGCATCA AGTGGCTGCG CCGCCTGAAG GTCGGCGACC GGCCGTTCCA GACGCGGGAG 
GAAACCTCGA AGTACACCGA CCTGATGCCG GACGGCACGG CGCGGCAATT CACCTTCGTG 
ATGGAGGCCA AGTCCGTCAT CACCGCGCCG TCGGGCGGCC AGCAGCTTCG GGAGCCCGGC 
TTTCACGAGA TCCGGGGCCT CGCCTGGACC GGGCGCGGGC GCATCGCCGG CGTCGAGGTC 
TCGACCGATG GCGGCGCCTC CTGGGCGGAG GCGCATCTGG AGGGGCCGGT GCTGCCGCGC 
TGCTTCACCC GCTTCCGCCT GCCGTGGCGT TGGGAGGGCG GACCGGCCAA ACTGCTGAGC 
CGGGCGCGGG ACGAGACCGG CTACGTGCAG CCGAGCCGCG AGGCCTTGGT CGCCGTGCGC 
GGCACCCGCT CCTTCTACCA CAACAACGCG GTGTTCGGCT GGAGCCTCGG CGCGAACGGG 
GCGGTGACCT ATGCGGCCTG A

Protein sequence

MGRVMENRRA FLRLAGSLAG AGAATGALAE AGSLDVPPWT REQGATAPGY GRPGPRETLA 
RYPRLPPPFP GAVATVTPLQ GLHGILTPNG LHYERHHAGI PAIDPDRHRL VVHGLVARPL 
ILTMDDILRF PAVSRLHFLE CSGNTPWLGA KPDWTVQDSH GLISCAEWTG VELSTLLAEV 
GVQPGAAWIL AEGADACAMT RSIPLDALDG AILAYAQNGE RLRPEQGYPL RLFLPGLEGN 
LSIKWLRRLK VGDRPFQTRE ETSKYTDLMP DGTARQFTFV MEAKSVITAP SGGQQLREPG 
FHEIRGLAWT GRGRIAGVEV STDGGASWAE AHLEGPVLPR CFTRFRLPWR WEGGPAKLLS 
RARDETGYVQ PSREALVAVR GTRSFYHNNA VFGWSLGANG AVTYAA