Gene Mext_1744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1744
Symbol
ID	5833052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	1965922
End bp	1967334
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	71%
IMG OID	641367543
Product	urate catabolism protein
Protein accession	YP_001639214
Protein GI	163851171
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0726] Predicted xylanase/chitin deacetylase [COG3195] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR03164] OHCU decarboxylase [TIGR03212] putative urate catabolism protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACACCT CCCGCGACCT GATCGGATAC GGCCGCACCG TTCCGCAGGC GGATTGGCCC 
GGCGGCGCCC GGATCGCCGT GCAGATCGTG CTCAACTACG AGGAGGGGGG CGAGAACTGC 
ATCCTGCACG GGGATGCGGC CTCCGAGGCG TTCCTCTCCG AAATCGTCGG CGCGGCGCCC 
TGGCCGGGCC TACGCCACAT GAACATGGAA TCGCTCTACG AGTACGGCGC CCGCGCCGGG 
TTCTGGCGGC TGTGGCGGCT GTTCACGCAA CGGGGCGTGC CGGTGACCGT ATTCGGCGTC 
GCCACCGCAC TCGCGCGCAA CCCGGAGGTC GTGGCCGCGA TGCGGGAGGC GGATTGGGAG 
ATCGCCAGCC ACGGCCTGAA ATGGATCGAT TACCGCGACA TGAAACGGGC GGAGGAGGCC 
GCGCAGATGG ATGCGGCGAT CCGGCTGCAC GAGGAGGTGA CGGGCGAGCG CCCCCTCGGC 
TGGTACACCG GCCGCTCCTC CGTCAACACG CTCGAACTCG GCCTGGAACG GGGCTTTTCC 
TATCTCGCCG ATTCCTACGC CGACGACCTG CCCTACTGGC TGTACGGGCG GGCCGGCACC 
GGCCTCGTGG TGCCCTACAC CCTCGACGCG AACGACATGC GCTTCGCCAC GCCGCAGGGC 
TTCAACACCG GCGAGCACTT CTTCACCTAC CTGCGCGACA GCTTCGACGC GCTCTACGCG 
GAGGGTGCCA CCACGCCGAA GATGATGTCG GTGGGGCTGC ACTGCCGTCT GGTCGGCCGG 
CCCGGCCGCA TCGCCGCCCT CGCGCGCTTC CTCGACCACG TCGCCGCCCA TGACGGCGTC 
TGGCTGGCGC GCCGCATCGA CATCGCCCGG CACTGGACGG CGCGGCACCC GGCCGAAGCC 
TTACGCCCGA GCACCATGAG CGCGGCGCAG TTCCTCACCC GGTTCGGCGA CATCTTCGAG 
GATACGCCGG AGATCGCGCT CCGGGCGTGG CAGGCGGGCC TCACCGCCCG CGAGGACAGC 
GCGGAGGGGC TCCATGCCGC CCTCGTCGGG GCCCTGCGCG GCCTGCCCGC CGAGCAACAG 
CGCGCCCTCA TCCGCGCCCA TCCCGAACTC GCCGGACGGC TCGCCCAGGC GGGACAGTTG 
ACGCAAGCCT CCACCACCGA GCAGGGCAGC GCCGGCCTCG GCGCGCTCTC GGCCGAGGAG 
CTGGCGCGAT TCGAGCGGCT GAACGCGGCC TACCGCGCAC GCTTCGACCT GCCCTTCATC 
ATGGCCATCA AGGGCAGCAG CCGCGAGGCG ATCCTGGCTG CGTTCGAGGC GCGGCTGCGC 
AACGATCCCG AGCAGGAGTT TCAGGAGGCT TTGCGCCAAA TCGAGCGGAT CGCGTGGCTG 
CGCCTGAAGG ACCGGCTGCC CTCGGAGAGT TGA

Protein sequence

MHTSRDLIGY GRTVPQADWP GGARIAVQIV LNYEEGGENC ILHGDAASEA FLSEIVGAAP 
WPGLRHMNME SLYEYGARAG FWRLWRLFTQ RGVPVTVFGV ATALARNPEV VAAMREADWE 
IASHGLKWID YRDMKRAEEA AQMDAAIRLH EEVTGERPLG WYTGRSSVNT LELGLERGFS 
YLADSYADDL PYWLYGRAGT GLVVPYTLDA NDMRFATPQG FNTGEHFFTY LRDSFDALYA 
EGATTPKMMS VGLHCRLVGR PGRIAALARF LDHVAAHDGV WLARRIDIAR HWTARHPAEA 
LRPSTMSAAQ FLTRFGDIFE DTPEIALRAW QAGLTAREDS AEGLHAALVG ALRGLPAEQQ 
RALIRAHPEL AGRLAQAGQL TQASTTEQGS AGLGALSAEE LARFERLNAA YRARFDLPFI 
MAIKGSSREA ILAAFEARLR NDPEQEFQEA LRQIERIAWL RLKDRLPSES