Gene Mmcs_1605 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1605
Symbol
ID	4110441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	1740535
End bp	1741563
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	69%
IMG OID	638030726
Product	histidinol-phosphate phosphatase
Protein accession	YP_638772
Protein GI	108798575
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0483] Archaeal fructose-1,6-bisphosphatase and related enzymes of inositol monophosphatase family
TIGRFAM ID	[TIGR02067] histidinol-phosphate phosphatase HisN, inositol monophosphatase family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTCGTCG ACCGTCGGGC CGTTGATCAC CCCGGAGATC GTGACGAACT GCTCCCCCGT 
CACGTCATCC GGACGGGGGC TGACGCCGGT CACCAGCAGA GTCCCCTGAG CGAGTTCGCC 
TCGCGGACCC CGGCTCCGCA TGATCCACGG CGCGGCCAGC ACGGCGATCG CCCCGATCAA 
CAACAGGAGC ACAGCGAATT CCCACACACG GCCATGGTAG GACTTGCAGA CATGAGCACC 
GGTTCCTCCA GCGTGGCCGA CGATCTGGCG TTGGCGTTGC GGCTCGCCGA CCATGCCGAC 
GCCGTCACCG TCGACCGGTT CCGCGCACTG GACCTCCACG TCGAGACCAA ACCCGATCTC 
ACGCCCGTGA CCGACGCCGA CCGTTCCGTG GAGAACGATC TGCGGCGCGC ACTCGCCGGG 
GAGCGCGGCG ACGACTCGGT CCTCGGTGAA GAGTTCGGTG GCACAGCTGT TTTCAGCGGC 
CGGCAGTGGG TGATCGACCC GATCGACGGG ACGAAGAACT TCGTGCGGGG TGTCCCGATC 
TGGGCGACGC TGATCTCGCT GCTGAACGAC GGGGTGCCGG TGGTCGGCGT GGTCAGTGCG 
CCAGCCCTGC ACCGTCGCTG GTGGGCGGCC GATGGGCTGG GCGCCTTCGT CACGGTCTCC 
GGCGAGTCGC CGCGGCGGCT GTCGGTGTCG AAGGTGGCCG AACTGGATTC GGCCAGCCTG 
TCGTTCTCCA GCCTGTCCGG GTGGGCCAAG CGCGGTCTGC GAGACCGATT CATCGACCTC 
ACGGACGCCG TCTGGCGCGT CCGAGGGTTC GGCGACTTCT TCTCCTACTG CCTGTTGGCC 
GAGGGGGCGG TGGACATCGC GGCCGAACCC GAGGTGTCGC TGTGGGATCT GGCCGCGATC 
GACATTCTCG TGCGCGAGGC CGGTGGGACG TTCACGAATC TCGACGGCGC GGCGGGTCCG 
CACGGAGGCA GCGTGGTCGC CTCCAACGGC CTGCTCCACG ACGCGGCGCT GGGCCACCTC 
TCGCGTTAA

Protein sequence

MLVDRRAVDH PGDRDELLPR HVIRTGADAG HQQSPLSEFA SRTPAPHDPR RGQHGDRPDQ 
QQEHSEFPHT AMVGLADMST GSSSVADDLA LALRLADHAD AVTVDRFRAL DLHVETKPDL 
TPVTDADRSV ENDLRRALAG ERGDDSVLGE EFGGTAVFSG RQWVIDPIDG TKNFVRGVPI 
WATLISLLND GVPVVGVVSA PALHRRWWAA DGLGAFVTVS GESPRRLSVS KVAELDSASL 
SFSSLSGWAK RGLRDRFIDL TDAVWRVRGF GDFFSYCLLA EGAVDIAAEP EVSLWDLAAI 
DILVREAGGT FTNLDGAAGP HGGSVVASNG LLHDAALGHL SR