Gene Mnod_1193 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_1193
Symbol
ID	7308633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	-
Start bp	1263034
End bp	1264395
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	69%
IMG OID	643598939
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_002496501
Protein GI	220921200
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR01015] homogentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.814651
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCACC ATCCCTCGCT GGAGGCTGCG GCGAAAAACT CGTCGGCGGC CCTCCATTCC 
GGCTACATGT CGGGCTTCGG CAACGGCTTC GAGACCGAGG CGCTGCCCGG CGCGCTGCCG 
ATCGGCCGCA ACTCGCCCCA GAAATGCCCC TATGGGCTCT ACGCCGAGCA GCTCTCGGGC 
TCGCCCTTCA CGGCGCCGCG CACCACCAAC GAGCGCTCCT GGCTCTACCG CATCCGCCCG 
ACCGTGATGC ATTGGGGCGC CTTCGCCAAG GCCGAGATCG GGCTGTGGCG CACCGCGCCG 
GCTGAGGTGG TCGAGCTGCC GATCGCGCCC CTGCGCTGGG ACCCGATCCC GATCCCCTCC 
GAGCCGCTCT CCTTCGTCGA GGGCATCCGC ACCATGACTA CGGCCGGGGA CGCCGGGTCC 
CAGGCCGGCA TGGGCGCGCA TCTCTACTTC GCCACCCGCT CGATGCGGGA CGAGTACTTC 
TACAACGCCG ACGGAGAGAT GCTGGTCGTG CCCCAGCAGG GGGCCTTGCG CTTCTGCACC 
GAGTTCGGGG TGATCGACAT CGAGCCCGGC GAGATCGCGG TGATCCCGCG CGGGGTGAAG 
ATCCGGGTCG AGCTCCCCGG CGGGCCGGCC CGCGGCTATC TCTGCGAGAA TTACGGCGGC 
GCCTTCACGC TGCCCGAGCG CGGCCCGATC GGCGCCAATT GCCTCGCCAA CCAGCGCGAC 
TTCCTCACCC CGGTCGCGGC CTACGAGGAC CGCGACGGCC CCGCCACCAT GCTGGTGAAG 
TGGGGCGGGA GCCTGTGGGC GGCGACGATC GACCACTCGC CCCTCGACGT GGTCGCCTGG 
CACGGCAACT ACGCGCCCTA CAAGTACGAC CTGCGCAAGT ACTCGCCGGT CGGGCCGATC 
CTGTTCGACC ATGCCGACCC GTCGATCTTC ACGGTGCTGA CCTCGCCCTC GGAGACGCCC 
GGCACCGCCA ACATCGATTT CGTGCTGTTC TCCGACCGCT GGCTGGTGGC CGAGAACACG 
TTCCGGCCGC CCTGGTATCA CCTGAACGTG ATGAGCGAGT TCATGGGGCT GGTCTACGGG 
GTCTACGACG CCAAGACCGG CGGCGGCTTC CAGCCCGGCG GGGTCTCGCT GCACAACACC 
CTGCTGCCGC ACGGGCCGGA CGTGGACGCC TTCGAGCGCG CCTCGAACGC CGAGCTCAAG 
CCGCACAAGC TCGAGGGCAC GCTCGCCTTC ATGTTCGAGA CCCGCTTCCC CCAGAAGGTC 
AGCCGCTTCG CGGCCGAGCA TCCGGCCCTG CAGAAGGACT ACGCAGGCTA CGGGCGCAAG 
CTCGCCAAGC ATTTCGATCC GCGCCGGCCA GAGGCTCGCT GA

Protein sequence

MTHHPSLEAA AKNSSAALHS GYMSGFGNGF ETEALPGALP IGRNSPQKCP YGLYAEQLSG 
SPFTAPRTTN ERSWLYRIRP TVMHWGAFAK AEIGLWRTAP AEVVELPIAP LRWDPIPIPS 
EPLSFVEGIR TMTTAGDAGS QAGMGAHLYF ATRSMRDEYF YNADGEMLVV PQQGALRFCT 
EFGVIDIEPG EIAVIPRGVK IRVELPGGPA RGYLCENYGG AFTLPERGPI GANCLANQRD 
FLTPVAAYED RDGPATMLVK WGGSLWAATI DHSPLDVVAW HGNYAPYKYD LRKYSPVGPI 
LFDHADPSIF TVLTSPSETP GTANIDFVLF SDRWLVAENT FRPPWYHLNV MSEFMGLVYG 
VYDAKTGGGF QPGGVSLHNT LLPHGPDVDA FERASNAELK PHKLEGTLAF MFETRFPQKV 
SRFAAEHPAL QKDYAGYGRK LAKHFDPRRP EAR