Gene Mmcs_1591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1591
Symbol
ID	4110427
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	1726826
End bp	1727932
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	68%
IMG OID	638030712
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_638758
Protein GI	108798561
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3508] Homogentisate 1,2-dioxygenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAATCAT TCGTCCACTT GCGAAAAGGC AAGACGCCGC GGCGACCGCA CGCCGATCTC 
GACGGCCAGA AAGACGACGA ACTGGGCCGG GGCGGCTTCA CCGGGCGGAC GGCCAACATG 
TATCGCCGCA ACGACCCGAC CGCGTTCCGC ACCGTCGGGC CGCTGCGCCC CATCGACGTG 
CTCGGCGACC AGCTCAAACC CGGTGACGCA ACCGACGCCG ACGGCGCACC GCTGCTGATG 
TTCTCCAACG CCGACTGCCA GGTCCTGCTG TCGCGGCGCA GCCAGGAGAT GCCGTATTTC 
GCCCGATACG TCGACGGCGA TCTGCTGTCC TTCGTGCACA CCGGGTCCGG TCTGCTCGAG 
ACGGAGTTCG GCCCGTTGCG CTACCGCGCC GGCGACTGGG TCTACATCCC GAAGGCGTGC 
ACGTTCCGCC AGATCCCGGA CACCGAATCC ACGCTGCTGA TGATCCAGGC CACCGACGAG 
TTCCGGGTGC CGCCGGCTGG CCCGCTCGGC CGGCATTTCC CGTTCGACCC GTCGCAGGCC 
GAGATCCCCG AGCCGGCGCC CATCGACGAC GGCGTCGGCC CGCAGGTCGA CGGCGAGTAC 
GAGGTCCGAC TGTTCCACGA GGGCGGCCCG ACATCGCTGT TCTACCAACA CCATCCGCTC 
GACGTCGAGG GGTGGCGCGG CGACAACTTC GCATTCACGT TCAACATCGA GGACTACAAC 
GTCGTCACCT CCGACAGCGT GCACCTGCCG GCCACCGCGC ATCTGTTCAT GCAGGCCACC 
GGCGTGTACG TGATGAACTT CCTCCCCAAA CCGGCCGAGG GGGTGCCCGG CACCGAACGC 
ACCCCCTGGT ACCACCGCAA CGTCGACTAC GACGAGATCG CGTTCTTCCA CGGCGGGACC 
CTGTACGGCA TCCCCATGCC GCCGGGGTTG ATCTCGCATG CGCCGCAGGG CGTCCACCAC 
GGCGCGCCTG AGAAGGCGCG GGAGCGGGCG CGTCGCAAGT TCGACGAGTA CCAACGGGTG 
GACTGGCAGG TCATCGCCGT CGACACCCGC AGGCGGTTGA TCCCGTCACC GGAGGTACTC 
GCCAACGACC TGGGGCAGCA CTCGTGA

Protein sequence

MESFVHLRKG KTPRRPHADL DGQKDDELGR GGFTGRTANM YRRNDPTAFR TVGPLRPIDV 
LGDQLKPGDA TDADGAPLLM FSNADCQVLL SRRSQEMPYF ARYVDGDLLS FVHTGSGLLE 
TEFGPLRYRA GDWVYIPKAC TFRQIPDTES TLLMIQATDE FRVPPAGPLG RHFPFDPSQA 
EIPEPAPIDD GVGPQVDGEY EVRLFHEGGP TSLFYQHHPL DVEGWRGDNF AFTFNIEDYN 
VVTSDSVHLP ATAHLFMQAT GVYVMNFLPK PAEGVPGTER TPWYHRNVDY DEIAFFHGGT 
LYGIPMPPGL ISHAPQGVHH GAPEKARERA RRKFDEYQRV DWQVIAVDTR RRLIPSPEVL 
ANDLGQHS