Gene Mkms_3586 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3586
Symbol
ID	4611516
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	3774621
End bp	3776201
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	70%
IMG OID	639793262
Product	prohead peptidase
Protein accession	YP_939570
Protein GI	119869618
COG category	[R] General function prediction only
COG ID	[COG3740] Phage head maturation protease
TIGRFAM ID	[TIGR01543] phage prohead protease, HK97 family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.286744
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0669671
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACACGC GGGCAGTCGA GTTGACCGAG GTCCGCACCG ACGACGACGC CGGGACTTTT 
ACCGGTCTCG CCGCCGGGTA CGACAACGTC GACACGCACG GCACCGTTCT ACAGCGCGGC 
GCGTTCGCAT CCTCGCTCGC CGGTGGCGGC GTCGTTCCGT TGTTCTGGGA ACACGGCCAC 
GACGATCCGC GGGCCATCGT CGGCGAGGTG ACCGCGGCCG TTGAGACCAC CCGCGGGCTG 
GAAATCGTCG GCAAGCTCGA CACCGACACC GAACGCGGCG CCGCCGCTTA CCGGGCGGTC 
AAAGGCCGAC GTATCCGCGG TCTGTCGGTC GGGATGCGCC CGACGCAGCG GCGCGGGGCG 
AGCATCATCG CCGCCGACCT CTGCGAAATC TCGCTGGTCA TGCGCCCCAG CAACAGCCGC 
GCGCTCGTTG AGTCGGTCCG GTCGGCCGAC GACGCGCTTC AAACCCGGGC GGCCAGCGCG 
GTCGCCACTT TCGAGACCAT CGCAAAGGAC ACCACCATGC CCGAGACCAT CACCACCGAA 
CGCCGCGACG AGCTCGTGGC CGAGACCCGC GGGCTCGTGG CCGCGGCTCA GGGCCGCACC 
TTGAGCGCTG AGGAAGTCGC CACCGTCGAG ACCAACACCG AGGCGATCCG CCGCCACGAC 
GAGCAGGCGT TGGAGACGCG CAACGACGCG CAGGCGGCGC GGCTGGCTCA GGCGCTCGGC 
CAGGCCATCG ACACCCGTTC GGGCGGTCGG CAGTCGCCGT TCATGCTCAG CGCCGACAAC 
GTCACCACGC TCGAGACCGC GCGCAAGCGC TTCGAGAACA TCACCGTTCT CGAGACCCGC 
GCGGCGCTGG CGACCACCGA CATGGGCACC GCTCGCGAGT ACGGCCCGAA CGGCCTGCAG 
GCGCCGCGGT CGCTGTGGCG TTCGGCCGGC ATCCCGACGA CCGCACCGGA CGGGTACAGC 
GGCGTCGTTC CGCAGTTCAC GCTGCCCGGT GGCGCGGTGC TCGTCGGTGA GGGCGTCGAC 
CACCAGGAGT TCGACGGCGT CAACCCCGAC GCGGTGACGA TCGGCCGTGC CGGTGCGTGG 
TCGACGCTGA CCTCCGAAGC GCTGCTATCC ACGAGCATCA CCGAGGTTTC GGCCGCGCAC 
GCGCGCATCA TCGCCCGCAA CGTTGACCGT GCGACGGTGG CGAAGATCGA GGACGCCAGC 
CCGGACACGA TGAGCATTGA TCAGGCGTTG GTGACGGTGG CTGCCGAATG CGCCTGCGAT 
GTCAGCGACT TGTGGATTGT CGGTGCGCCG GCCGCGGTGG CGGCGCTCGT CGGCAATGCG 
ACCTTCACGC CCGCCAACGG CGGCGACGCA GAGTCCTACG CATCCCGCTA CGGCGGTGCG 
GCGGTGTACC CGACGACCTC GGCGACCGCG GACACGCTGA CGGTGTTCCA TCCGCAGAGC 
TTCCGCGCGT TCGCGTCGCC ATTGTCGTCG GGCGTGTTCG TGGATCCGAA GTCGGGCAAG 
CAGGACTTTG GTCAGTGGAT GTTCTACGGG CTCGGACAGG CGCTCGTGGG CGCCGCGATC 
ACCGTGGACA CCACCCCATA G

Protein sequence

MHTRAVELTE VRTDDDAGTF TGLAAGYDNV DTHGTVLQRG AFASSLAGGG VVPLFWEHGH 
DDPRAIVGEV TAAVETTRGL EIVGKLDTDT ERGAAAYRAV KGRRIRGLSV GMRPTQRRGA 
SIIAADLCEI SLVMRPSNSR ALVESVRSAD DALQTRAASA VATFETIAKD TTMPETITTE 
RRDELVAETR GLVAAAQGRT LSAEEVATVE TNTEAIRRHD EQALETRNDA QAARLAQALG 
QAIDTRSGGR QSPFMLSADN VTTLETARKR FENITVLETR AALATTDMGT AREYGPNGLQ 
APRSLWRSAG IPTTAPDGYS GVVPQFTLPG GAVLVGEGVD HQEFDGVNPD AVTIGRAGAW 
STLTSEALLS TSITEVSAAH ARIIARNVDR ATVAKIEDAS PDTMSIDQAL VTVAAECACD 
VSDLWIVGAP AAVAALVGNA TFTPANGGDA ESYASRYGGA AVYPTTSATA DTLTVFHPQS 
FRAFASPLSS GVFVDPKSGK QDFGQWMFYG LGQALVGAAI TVDTTP