Gene Mkms_2997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_2997
Symbol
ID	4610827
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	3129101
End bp	3130105
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	73%
IMG OID	639792663
Product	HAD family hydrolase
Protein accession	YP_938981
Protein GI	119869029
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0647] Predicted sugar phosphatases of the HAD superfamily
TIGRFAM ID	[TIGR01460] Haloacid Dehalogenase Superfamily Class (subfamily) IIA

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.411928
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.553212
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGCAAC ATGATTGCCT GCTCCTCGAT CTGGATGGCA CGGTGTTCCG CGGCCACGAA 
CCGACCACCG GAGCCGTCGA GAGCCTCGCC GGGCTGAGCG CGCGGGTCCT CTACGTCACC 
AACAACGCCT CACGCAGCCC GGGCGACGTC GCAGGCCACC TCGTCGAGTT GGGGTTCCAC 
GCCGACGCCG CCGACGTGGT GACCAGCGCC CAGAGCGCAG CGCACCTGCT CGCCGCCCAA 
CTTCCCGCCG GGGCGCGGGT GCTGGTCGTG GGCACCGAGG CGTTGGCGGC CGAGGTCGAC 
CTCGTGGGAC TGCAGCCGGT CCGGCAGTTC GCCGACGATC CCGCCGCCGT TGTGCAGGGG 
CACAACCCGG AGACGGCGTG GGCGGACCTC GCCGAGGCGG CGCTGGCCCT GCGCGCCGGG 
GCCCTGTGGG TGGCGGCCAA TGTCGATCTG ACCCTGCCGT CCGAGCGCGG ACTGTTGCCT 
GGCAACGGTT CGATGGTCGC CGCCCTGCAG GCCGCGACCG CCCGCGAACC TCAGGTCGCC 
GGCAAGCCGC AGCCGACGCT GATGCGGGAT GCGTTGAGCC GGGGCGACTT TCACACACCG 
CTGGTTGTCG GTGACCGTCT GGACACCGAC ATCGCCGGCG CCAACGCGGC GTCGTTGCCG 
AGCCTGATGG TGCTCAGCGG TGTCAGCACC GCCGACGAGG TGCTGCGTGC GGTGCCCCAG 
GAGCGGCCCG ACTACATCGC CGAGGATCTG CGCTCCCTGG ACGCACCGGC CGACGACCTG 
CGGGTCGGTC CCCACCCCGG CTGGCGCATC GAGGTCGATG GCGCGGACGT GACCGTCCAC 
GCCGACGGCG TCGACCGCGG GGACGACCTC TCGGTGCTGC GTGCGACGGC CCACGTGGTG 
TGGCAGTCGG ACCTGGCGGG CACGCCGTTC GCGGTCCGCG CGGGTGACGA CACCGCGGCC 
GCCGCGCTGC AACGGTGGTC GCTGCTCACC GCCGCGATCG ACTAG

Protein sequence

MQQHDCLLLD LDGTVFRGHE PTTGAVESLA GLSARVLYVT NNASRSPGDV AGHLVELGFH 
ADAADVVTSA QSAAHLLAAQ LPAGARVLVV GTEALAAEVD LVGLQPVRQF ADDPAAVVQG 
HNPETAWADL AEAALALRAG ALWVAANVDL TLPSERGLLP GNGSMVAALQ AATAREPQVA 
GKPQPTLMRD ALSRGDFHTP LVVGDRLDTD IAGANAASLP SLMVLSGVST ADEVLRAVPQ 
ERPDYIAEDL RSLDAPADDL RVGPHPGWRI EVDGADVTVH ADGVDRGDDL SVLRATAHVV 
WQSDLAGTPF AVRAGDDTAA AALQRWSLLT AAID