Gene Mkms_5149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_5149
Symbol
ID	4612832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	5396167
End bp	5397171
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	68%
IMG OID	639794846
Product	hypothetical protein
Protein accession	YP_941128
Protein GI	119871176
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1387] Histidinol phosphatase and related hydrolases of the PHP family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCCCG TGACCGCGCT GCGCCAGATC GCGTACTTCA AGGACCGCGC CCGCGAGGAC 
TCCCGACGGG TGATGGCCTA CCGCAACGCC GCCGACGTCG TGGAGCGGCT CACCGAAGCC 
GAACGTGACC GCCACGGCGC CGCCGATTCG TGGCAGTCGC TGCCCGGAAT CGGGCCCAAG 
ACGGCGAAGG TGATCGCGCA GGCGTGGGCC GGCCGCGAAC CCGACGTGCT CGTCGAATTG 
CGGGAGAGCG CAGTCGATCT CGGCGGCGGT GAGATCCGCG CGGCACTCAA GGGCGATCTG 
CACGTGCACT CCAACTGGTC GGACGGGTCG GCGCCGATCG AGGAGATGAT GCTCGCCGCC 
CGCGACCTCG GGCACGAGTA CTGCGTGTTG ACCGACCACT CACCGCGGTT GACCATCGCC 
AACGGGCTGT CCCCGGACCG GCTGCGCAAA CAGCTCGACG TCATCGACGA GCTCCGGGAA 
AGTGTTGCAC CCCTTCGCAT TCTGACCGGC ATCGAAGTCG ACATCCTCGA GGACGGCTCC 
CTCGACCAGG AGGAGGACCT GCTCGAGCGC CTCGACGTGG TGGTGGCCAG CGTGCACTCC 
AAACTGGCGA TGGACGCCCC GGCGATGACA CGCCGCATGC TCAAGGCCGT CGCCAACCCG 
CACACCGACG TGCTCGGCCA CTGCACCGGG CGGTTGGTCA CCGGAAATCG CGGAATCCGG 
CCTGAATCGA AATTCGACGC CGAGAAGGTG TTCACCGCGT GCCGCGACAA CGGCACCGCC 
GTCGAGATCA ACTCCCGCCC CGAACGGCGG GATCCCCCCA CCCGGCTGTT GAAGCTCGCG 
CTCGACATCG GTTGCGTGTT CTCGATCGAC ACCGATTCGC ACGCGCCGGG TCAGCTGGAC 
TTCCTCGGCT ATGGCGCACA ACGGGCGCTC GACGCCGGGG TGCCCGTGGA GCGGATCGTC 
AACACCTGGC CGGCCGACGA TCTGCTGGCG TGGACCACTT CCTGA

Protein sequence

MDPVTALRQI AYFKDRARED SRRVMAYRNA ADVVERLTEA ERDRHGAADS WQSLPGIGPK 
TAKVIAQAWA GREPDVLVEL RESAVDLGGG EIRAALKGDL HVHSNWSDGS APIEEMMLAA 
RDLGHEYCVL TDHSPRLTIA NGLSPDRLRK QLDVIDELRE SVAPLRILTG IEVDILEDGS 
LDQEEDLLER LDVVVASVHS KLAMDAPAMT RRMLKAVANP HTDVLGHCTG RLVTGNRGIR 
PESKFDAEKV FTACRDNGTA VEINSRPERR DPPTRLLKLA LDIGCVFSID TDSHAPGQLD 
FLGYGAQRAL DAGVPVERIV NTWPADDLLA WTTS