Gene Mkms_1654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_1654
Symbol
ID	4613942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	1769605
End bp	1770690
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	62%
IMG OID	639791325
Product	cupin 2 domain-containing protein
Protein accession	YP_937651
Protein GI	119867699
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3435] Gentisate 1,2-dioxygenase
TIGRFAM ID	[TIGR02272] gentisate 1,2-dioxygenase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACCG CCGAGAGTTC AGAGCTCCGC GAATTTGACG TCGAGCTCGA GGCTGCCAAC 
TTACGTGGGC AATGGATATA CGACGAAATG CTGGAAAGCG TCGTCGGCGG CCCCAAGCCC 
GCCGGTGTTC CGTTTCTGTG GCGATGGCAC GATGTTTACG CGAAGCTTCT GAAGTCGTGC 
GACGTGATGC CTGAAAGTTT GACGGCGCGA CGCAATCTCT CGTTCATCAA TCCGGATGCC 
CGGGGAACCA CGCACACCAT GAACATGGGT ATGCAGATGC TCAAGCCCGG CGAGATTGCC 
TATGCGCACC GCCATACCAT GGCAGCGCTG CGGTTCGCTA TTCAAGGCGG CCCCGGCCTG 
GTGACTGTGG TGGATGGCGA GCCTTGTCAA ATGGATACCT ACGACCTGGT TCTGACCCCT 
CGCTGGACGT GGCATGACCA TGAGAATGCC ACCTCGGAGA ACGTCGTTTG GCTCGACGTG 
CTCGATATCG GCCTAGTGCT CGGGCTGAAT GTTCCCTTCT ATGAGTCCTA TGGCGAGAAG 
CGCCAACCTC AACGCGAGGA CCCGGGGGAG CATCTCGCTG ACCGCGGTGG GATGCTGCGC 
CCTGCGTGGG AGCAGGTCAA GGCGGCGAAC TTCCCGTACC GCTATCCTTG GCGTGACGTC 
GAGCGGCAGC TCCAGCGGAT GGCGGGCCTT GCGGGCAGTC CTTACGACGG CGTAGTCCTG 
CGTTATGCGA ACCCCGTTAC CGGCGGATCG ACTATGCCAA CGCTGGATTG CTGGGTGCAG 
TTGCTGCGGC CGGGCCAGCG GACCGAGGCC CATCGCCACA CGTCGAGTGC CGTGTATTTC 
GTCGTGCGCG GTGAGGGAAC TACGGTTGTC GACGGGGTCG AACTCGACTG GGGGCCCCAC 
GACAGCTTCG TGGTGCCCAA CTGGAGCACC CATCACTTCG TCAACCGGTC GGCGGAAGAT 
GCGTTGCTGT TCTCGGTCAA CGACATCCCT ACATTGAAGG CTCTCGATCT CTACTACGAA 
GAGCCCGAGC TGTCTTTGGG GACGCAGCCA TTTCCGCCGG TCCCCGCTAA CCTCCGAGCC 
CGCTGA

Protein sequence

MSTAESSELR EFDVELEAAN LRGQWIYDEM LESVVGGPKP AGVPFLWRWH DVYAKLLKSC 
DVMPESLTAR RNLSFINPDA RGTTHTMNMG MQMLKPGEIA YAHRHTMAAL RFAIQGGPGL 
VTVVDGEPCQ MDTYDLVLTP RWTWHDHENA TSENVVWLDV LDIGLVLGLN VPFYESYGEK 
RQPQREDPGE HLADRGGMLR PAWEQVKAAN FPYRYPWRDV ERQLQRMAGL AGSPYDGVVL 
RYANPVTGGS TMPTLDCWVQ LLRPGQRTEA HRHTSSAVYF VVRGEGTTVV DGVELDWGPH 
DSFVVPNWST HHFVNRSAED ALLFSVNDIP TLKALDLYYE EPELSLGTQP FPPVPANLRA 
R