Gene Mmcs_1698 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1698
Symbol
ID	4110532
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	1836098
End bp	1837285
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	65%
IMG OID	638030817
Product	protocatechuate 3,4-dioxygenase, beta subunit
Protein accession	YP_638863
Protein GI	108798666
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3485] Protocatechuate 3,4-dioxygenase beta subunit
TIGRFAM ID	[TIGR02422] protocatechuate 3,4-dioxygenase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCACGGTG GCAAGGGTCG CCGCGTATAC GTCATACAAG AACGGTTCAG CCACCTGGCG 
CAATTGGCCT TCCACCGGCG CCAGCAATCC CGCGTTCCAG ACCAGCCTGC CCACCACGTA 
CTGACCGTCG GCGCGGCGCT GCAATGCCGA GCCGGCGACC AACTCGGCCG CAAGGCGGTG 
TGTGGTGGCA ATCGGCAGTC CGGCCCGGCG GGCCAACTCG GACAGCGTCA GGCTGTTATG 
CCGCTCGTCG AAGGCGCCGA GAATGTTCAG CAAACGCGAG GTGACAGTGG TTCCCGGCGT 
CGAAGTGTTC CCTGCCAATT ATGGATGGCC TTTCCGCTCA GTGGAATTCT ACCGTTCGCC 
AATCTCAACG TCGTCGGTAC CGTAGGCGCC GTGACAACGT CGATCGACAG CAATCCCGAC 
GGCGCCGTAG CGAGCCAGTC GGAGATCAGC GCGGAGATCG GTGCGATCGA GTCCGCCTAC 
CAGCGTGCAG GGGTCGAGGA GACGCAGCCG CGCCTGAGTT ATCCGCCTTA CCGGAGCAGC 
CTGCTACGGC ATCCGACAAA GGACCTTCAC CACGCCGACC CGGAAGGGGT CGAGCTATGG 
ACGCCGTGCT TCTCCGAACG CGACGTTCAC CCGCTGGAGG CCGACCTCAC CGTCCAGCAC 
TCGGGTGAAC CCATCGGTGA ACGACTGGTG GTGACCGGCA GGGTCGTCGA CGGCGCAGGG 
CGGCCGGTGC GGCGCCAGCT CGTCGAGATT TGGCAGGCCA ACGCCGGCGG ACGTTACATC 
CACAAGGGGG ATCAGCACCC GTCCCCAATC GACCCCAACT TCACCGGCGC CGGCCGCTGT 
TTGACCGACG AGGACGGCAT CTACCGGTTC ACCACGATCA AGCCGGGGCC GTATCCGTGG 
AAGAACCACC GCAACGCGTG GCGGCCCGCA CACATCCACT TCTCGCTCTT CGGCACGGAA 
TTCACGCAGC GAATGGTCAC CCAGATGTAC TTCCCGGGTG ACCCGCTCCT CTGCCTTGAT 
CCGATCTTCC AGGCGATCCC GGATCAGAAG GCGCGCAGCC GGCTGGTGGC CAGCTACGAT 
CACGAACTCA GCACCCACGA ATGGGCTACC GGCTACCGAT GGGACGTCGT CCTGACCGGG 
TCGGCGCGCA CCCCAATCGA GAACCTCGGC CGCGGAGCCC ACCGCTGA

Protein sequence

MHGGKGRRVY VIQERFSHLA QLAFHRRQQS RVPDQPAHHV LTVGAALQCR AGDQLGRKAV 
CGGNRQSGPA GQLGQRQAVM PLVEGAENVQ QTRGDSGSRR RSVPCQLWMA FPLSGILPFA 
NLNVVGTVGA VTTSIDSNPD GAVASQSEIS AEIGAIESAY QRAGVEETQP RLSYPPYRSS 
LLRHPTKDLH HADPEGVELW TPCFSERDVH PLEADLTVQH SGEPIGERLV VTGRVVDGAG 
RPVRRQLVEI WQANAGGRYI HKGDQHPSPI DPNFTGAGRC LTDEDGIYRF TTIKPGPYPW 
KNHRNAWRPA HIHFSLFGTE FTQRMVTQMY FPGDPLLCLD PIFQAIPDQK ARSRLVASYD 
HELSTHEWAT GYRWDVVLTG SARTPIENLG RGAHR