Gene Mmcs_5061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_5061
Symbol
ID	4113890
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	5358545
End bp	5359549
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	68%
IMG OID	638034219
Product	hypothetical protein
Protein accession	YP_642221
Protein GI	108802024
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1387] Histidinol phosphatase and related hydrolases of the PHP family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACCCCG TGACCGCGCT GCGCCAGATC GCGTACTTCA AGGACCGCGC CCGCGAGGAC 
TCCCGACGGG TGATGGCCTA CCGCAACGCC GCCGACGTCG TGGAGCGGCT CACCGAAGCC 
GAACGTGACC GCCACGGCGC CGCCGATTCG TGGCAGTCGC TGCCCGGAAT CGGGCCCAAG 
ACGGCGAAGG TGATCGCGCA GGCGTGGGCC GGCCGCGAAC CCGACGTGCT CGTCGAATTG 
CGGGAGAGCG CAGTCGATCT CGGCGGCGGT GAGATCCGCG CGGCACTCAA GGGCGATCTG 
CACGTGCACT CCAACTGGTC GGACGGGTCG GCGCCGATCG AGGAGATGAT GCTCGCCGCC 
CGCGACCTCG GGCACGAGTA CTGCGTGTTG ACCGACCACT CACCGCGGTT GACCATCGCC 
AACGGGCTGT CCCCGGACCG GCTGCGCAAA CAGCTCGACG TCATCGACGA GCTCCGGGAA 
AGTGTTGCAC CCCTTCGCAT TCTGACCGGC ATCGAAGTCG ACATCCTCGA GGACGGCTCC 
CTCGACCAGG AGGAGGACCT GCTCGAGCGC CTCGACGTGG TGGTGGCCAG CGTGCACTCC 
AAACTGGCGA TGGACGCCCC GGCGATGACA CGCCGCATGC TCAAGGCCGT CGCCAACCCG 
CACACCGACG TGCTCGGCCA CTGCACCGGG CGGTTGGTCA CCGGAAATCG CGGAATCCGG 
CCTGAATCGA AATTCGACGC CGAGAAGGTG TTCACCGCGT GCCGCGACAA CGGCACCGCC 
GTCGAGATCA ACTCCCGCCC CGAACGGCGG GATCCCCCCA CCCGGCTGTT GAAGCTCGCG 
CTCGACATCG GTTGCGTGTT CTCGATCGAC ACCGATTCGC ACGCGCCGGG TCAGCTGGAC 
TTCCTCGGCT ATGGCGCACA ACGGGCGCTC GACGCCGGGG TGCCCGTGGA GCGGATCGTC 
AACACCTGGC CGGCCGACGA TCTGCTGGCG TGGACCACTT CCTGA

Protein sequence

MDPVTALRQI AYFKDRARED SRRVMAYRNA ADVVERLTEA ERDRHGAADS WQSLPGIGPK 
TAKVIAQAWA GREPDVLVEL RESAVDLGGG EIRAALKGDL HVHSNWSDGS APIEEMMLAA 
RDLGHEYCVL TDHSPRLTIA NGLSPDRLRK QLDVIDELRE SVAPLRILTG IEVDILEDGS 
LDQEEDLLER LDVVVASVHS KLAMDAPAMT RRMLKAVANP HTDVLGHCTG RLVTGNRGIR 
PESKFDAEKV FTACRDNGTA VEINSRPERR DPPTRLLKLA LDIGCVFSID TDSHAPGQLD 
FLGYGAQRAL DAGVPVERIV NTWPADDLLA WTTS