Gene Mext_4441 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4441
Symbol
ID	5834104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	4945940
End bp	4947226
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	68%
IMG OID	641370234
Product	glucose sorbosone dehydrogenase
Protein accession	YP_001641880
Protein GI	163853837
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.672706
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGCGCA CCCTTTCCCT CTTGCTCGCC ACCGTTGCGG CCCTCGGCCT CGATGCCCCA 
GCCTTCGCTC AGCAGCCAGC CGGACAGGAA TCGCGCTCGC CCCGCATCGA GGGTGAATCG 
TTCCAGGCGC CGGCCGCGCC GAGTGCCGGC ACATCGATCG CCGAGAAGGA GGCGCCGAAC 
ACCGAGTACA AGCCGCTCCT GCCCAACCAG ACCCGTGCGC CGGAGCCCGC GCAGAAGACC 
GAGTTCGAGA CCGCCGTCGT GGCCAAGGGC CTGGAAAGCC CCTGGGCGAT GGAGTTCCTG 
CCCGATGGCC GCATGATCGT GACCGAGAAG GCTGGAAAGA TCCGCCTGAT CGCCAAGGAC 
GGCACGGTGG GCCAGCCGGT GGCGGGCGTG CCGAAGGTTG ATTCCAAGGG GCAGGGCGGT 
CTTCTCGACG TCGCGCTGAG CCCGAGCTTC GCCGCGGATC GCACGATCTA CTTCAGCTAC 
AGCGAGCCGC GCGACAAGGG CAACGGCACC ACGGTCGCCA AGGCCAAGCT GGTCGAGAGC 
GATGGCAAGG CGAAGCTCGA CGACGTCAAG GTCATCTTCC GCCAGATGCC GACCTATGAC 
GGCGACAAGC ATTTCGGCTC GCGCCTCGTC TTCGCGCCGG ACGGCAAGCT GTTCGTCACC 
GTGGGCGAGC GCTCCGACAA GCAGACCCGC GGGCAGGCGC AGGATCTGAC GAGCGGGCTC 
GGCAAGGTCT TCCGCATCGA CACCGACGGC AATGCCCCGA AGGACAACCC CTTCACCGGC 
GGCGAGAAGG CCAAGCCCGA GATCTGGTCC TACGGCCACC GCAACGTCCA GGCCGCCGCC 
CTGGACAACC AGGGCCGGCT CTGGACCGTG GAGCACGGGC CGCGCGGCGG CGACGAGCTG 
AACCGCCCGC GCCCCGGCCT CAACTACGGC TGGCCGGTGG TCACCTACGG CATCGAGTAT 
TCCGGCGAGA AGATCGGCGA CGGCCAGACC CAGGCCGGCG GCACGGTGCA GCCGGTCTAT 
TACTGGGATC CGGTGATCGG CCCCTCGGGC ATGGCGCTCT ACGACAAGGA CGCGTTCCCG 
GCCTGGAAGA ACCAGTTCCT CATCGGCGGC CTCGTCAGCA CCGGGATCGT CGCGCTCAAG 
CTCGACGGCG ACAAGGTCGT CACCGAGGAG CGCATCCCGC TGGAACACCG CGTCCGCGAC 
GTGCGGGTCG GCCCCGATGG TGCCGTCTAC GCGGTCACCG AGGATGACGG CCAGATCGTC 
AAGCTGACGC CGAAGAAGGG CAGCTGA

Protein sequence

MTRTLSLLLA TVAALGLDAP AFAQQPAGQE SRSPRIEGES FQAPAAPSAG TSIAEKEAPN 
TEYKPLLPNQ TRAPEPAQKT EFETAVVAKG LESPWAMEFL PDGRMIVTEK AGKIRLIAKD 
GTVGQPVAGV PKVDSKGQGG LLDVALSPSF AADRTIYFSY SEPRDKGNGT TVAKAKLVES 
DGKAKLDDVK VIFRQMPTYD GDKHFGSRLV FAPDGKLFVT VGERSDKQTR GQAQDLTSGL 
GKVFRIDTDG NAPKDNPFTG GEKAKPEIWS YGHRNVQAAA LDNQGRLWTV EHGPRGGDEL 
NRPRPGLNYG WPVVTYGIEY SGEKIGDGQT QAGGTVQPVY YWDPVIGPSG MALYDKDAFP 
AWKNQFLIGG LVSTGIVALK LDGDKVVTEE RIPLEHRVRD VRVGPDGAVY AVTEDDGQIV 
KLTPKKGS