Gene Mnod_1036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_1036
Symbol
ID	7302580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	-
Start bp	1107162
End bp	1108826
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	71%
IMG OID	643598785
Product	urocanate hydratase
Protein accession	YP_002496347
Protein GI	220921046
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2987] Urocanate hydratase
TIGRFAM ID	[TIGR01228] urocanate hydratase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0275392
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCGCC TCGACAATGC CCGCATCGTC CGCGCTCCCC GCGGCCCCGC CCTCACGGCC 
AAGAGCTGGC TCACCGAGGC GCCCCTGCGG ATGCTGATGA ACAACCTCGA TCCGGATGTC 
GCGGAGCGGC CGGGCGACCT CGTCGTCTAT GGCGGCATCG GCCGGGCGGC GCGGGACTGG 
GCCAGCTTCG ACCGGATCGT CGCCGCGCTC AAGGACCTCG ACGAGGACCA GACGCTCCTC 
GTGCAGTCGG GTAAGCCGGT CGGAATCTTC CGCACCCATC CGGACGCGCC GCGGGTGCTG 
ATCGCCAATT CCAACCTCGT GCCGCACTGG GCGACCTGGG CCCATTTCCA CGAGCTCGAT 
CGCAAGGGCC TGATGATGTA CGGCCAGATG ACGGCCGGCT CCTGGATCTA CATCGGCAGC 
CAGGGCATCG TGCAGGGCAC CTACGAGACC TTCGTGGAGA TGGGCCGCCA GCATTACGGC 
GGCGACCTCG CGGGGCGCTG GATCCTGACC GCGGGCCTCG GGGGCATGGG CGGCGCGCAG 
CCGCTCGCCG CCACCATGGC CGGGGCCTCC TGCCTCGCCG TCGAGTGCCG GGCATCGAGC 
ATCGAGTTCC GCCTGCGCAC GGGCTATGTC GACGTCCAGG CCCGCGACCT CGACGAGGCG 
CTCGCCCTGA TCGACGAATC CTGCCGGGCG CGGGTGCCCC GCTCCGTGGC GCTCATCGGC 
AACGCCGCCG AGGTCTTCGC CGAGATCCAG CGCCGTGGCG TGCGGCCGGA TTGCGTCACC 
GACCAGACCT CCGCGCACGA CCCCGTCAAT GGCTACCTGC CCCGGGGCTG GAGCATCGCC 
GAGTGGGAGG CGCGGCGCGA GAGCGACCCG GACGGGGTCG CGGCGGCCGC CAAGCGCTCC 
ATGGCCGAGC AGGTGCGGGT GATGCTGGCC TTCCACCGGG CCGGCGTGCC GACCGTCGAT 
TACGGCAACA ACATCCGGCA GATGGCGCTG GAGGAAGGGG TGGCGGACGC CTTCGCCTTC 
CCGGGCTTCG TGCCGGCCTA TATCCGCCCG CTCTTCTGCC GCGGCGTCGG GCCGTTCCGC 
TGGTGCGCCC TCTCGGGCGA TCCGGAGGAC ATTTACCGCA CCGACGCCAA GGTGAAGCAG 
CTTCTGCCCG ACAATGCCCA CCTGCACCGC TGGCTCGACA TGGCCCGGGA CAAGATCCGG 
TTCCAGGGCC TGCCGGCGCG GATCTGCTGG GTGGGCCTGG GCGACCGCCA CCGGCTCGGC 
CTTGCCTTCA ACGCCATGGT GCGCAGCGGG GAGCTCAAGG CGCCGATCGT GATCGGGCGC 
GACCACCTCG ATTCCGGCTC CGTCGCCTCC CCCAACCGGG AGACGGAGGC GATGCGCGAC 
GGCTCGGACG CGGTCTCGGA CTGGCCGCTT CTCAACGCCC TCCTCAACAC CGCCTCGGGC 
GCCACCTGGG TGTCGCTCCA CCACGGCGGC GGGGTCGGGA TGGGCTTCTC GCAGCATGCC 
GGCATGGTGA TCGTCTGCGA CGGCAGCGAG GCCGCGGACC GGCGCCTGGA GCGGGTGCTG 
TGGAACGATC CGGCCACGGG CGTGATGCGC CACGCCGATG CCGGCTACCC GGAGGCGATC 
GCCTGTGCGC GGGAACAGGG GTTGGTCCTG CCGAGCCTGG GCTAG

Protein sequence

MTRLDNARIV RAPRGPALTA KSWLTEAPLR MLMNNLDPDV AERPGDLVVY GGIGRAARDW 
ASFDRIVAAL KDLDEDQTLL VQSGKPVGIF RTHPDAPRVL IANSNLVPHW ATWAHFHELD 
RKGLMMYGQM TAGSWIYIGS QGIVQGTYET FVEMGRQHYG GDLAGRWILT AGLGGMGGAQ 
PLAATMAGAS CLAVECRASS IEFRLRTGYV DVQARDLDEA LALIDESCRA RVPRSVALIG 
NAAEVFAEIQ RRGVRPDCVT DQTSAHDPVN GYLPRGWSIA EWEARRESDP DGVAAAAKRS 
MAEQVRVMLA FHRAGVPTVD YGNNIRQMAL EEGVADAFAF PGFVPAYIRP LFCRGVGPFR 
WCALSGDPED IYRTDAKVKQ LLPDNAHLHR WLDMARDKIR FQGLPARICW VGLGDRHRLG 
LAFNAMVRSG ELKAPIVIGR DHLDSGSVAS PNRETEAMRD GSDAVSDWPL LNALLNTASG 
ATWVSLHHGG GVGMGFSQHA GMVIVCDGSE AADRRLERVL WNDPATGVMR HADAGYPEAI 
ACAREQGLVL PSLG