Gene Mmcs_3514 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_3514
Symbol
ID	4112346
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	3740139
End bp	3741719
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	70%
IMG OID	638032649
Product	prohead peptidase
Protein accession	YP_640677
Protein GI	108800480
COG category	[R] General function prediction only
COG ID	[COG3740] Phage head maturation protease
TIGRFAM ID	[TIGR01543] phage prohead protease, HK97 family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACACGC GGGCAGTCGA GTTGACCGAG GTCCGCACCG ACGACGACGC CGGGACTTTT 
ACCGGTCTCG CCGCCGGGTA CGACAACGTC GACACGCACG GCACCGTTCT ACAGCGCGGC 
GCGTTCGCAT CCTCGCTCGC CGGTGGCGGC GTCGTTCCGT TGTTCTGGGA ACACGGCCAC 
GACGATCCGC GGGCCATCGT CGGCGAGGTG ACCGCGGCCG TTGAGACCAC CCGCGGGCTG 
GAAATCGTCG GCAAGCTCGA CACCGACACC GAACGCGGCG CCGCCGCTTA CCGGGCGGTC 
AAAGGCCGAC GTATCCGCGG TCTGTCGGTC GGGATGCGCC CGACGCAGCG GCGCGGGGCG 
AGCATCATCG CCGCCGACCT CTGCGAAATC TCGCTGGTCA TGCGCCCCAG CAACAGCCGC 
GCGCTCGTTG AGTCGGTCCG GTCGGCCGAC GACGCGCTTC AAACCCGGGC GGCCAGCGCG 
GTCGCCACTT TCGAGACCAT CGCAAAGGAC ACCACCATGA CCGAGCCCAT CACCACCGAA 
CGCCGCGACG AGCTCGTGGC CGAGACCCGC GGGCTCGTGG CCGCGGCTCA GGGCCGCACG 
CTGACCGCCG AGGAAGTCGC CACCATCGAG ACCAACACCG AGACGATCCG CCGCCACGAC 
GAGCAGGCGT TGGAGACGCG CAACGACGCG CAGGCGGCCA ACATCGCCCG CGCGCTCGGT 
CAGGCCATCG ACACCCGTTC GGGCGGTCGG CAGTCGCCGT TCATGCTCAG CGCCGACAAC 
GTCACCACGC TCGAGACCGC GCGCAAGCGC TTCGAGAACA TCACCGTTCT CGAGACCCGC 
GCGGCGCTGG CGACCACCGA CATGGGCACC GCTCGCGAGT ACGGCCCGAA CGGCCTGCAG 
GCGCCGCGGT CGCTGTGGCG TTCGGCCGGC ATCCCGACGA CCGCACCGGA CGGGTACAGC 
GGCGTCGTTC CGCAGTTCAC GCTGCCCGGT GGCGCGGTGC TCGTCGGTGA GGGCGTCGAC 
CACCAGGAGT TCGACGGCGT CAACCCCGAC GCGGTGACGA TCGGCCGTGC CGGTGCGTGG 
TCGACACTGA CCTCCGAAGC GCTGCTATCC ACGAGCATCA CCGAGGTTTC GGCCGCGCAC 
GCGCGCATCA TCGCCCGCAA CGTTGACCGT GCGACGGTGG CGAAGATCGA GGACGCCAGC 
CCGGACACGA TGAGCATTGA TCAGGCGTTG GTGACGGTGG CTGCCGAATG CGCCTGCGAT 
GTCAGCGACT TGTGGATTGT CGGTGCGCCG GCCGCGGTGG CGGCGCTCGT CGGCAATGCG 
ACCTTCACGC CCGCCAACGG CGGCGACGCA GAGTCCTACG CATCCCGCTA CGGCGGTGCG 
GCGGTGTACC CGACGACCTC GGCGACCGCG GACACGCTGA CGGTGTTCCA TCCGCAGAGC 
TTCCGCGCGT TCGCGTCGCC ATTGTCGTCG GGCGTGTTCG TGGATCCGAA GTCGGGCAAG 
CAGGACTTCG GTCAGTGGAT GTTCTACGGG CTCGGACAGG CGCTCGTGGG CGCCGCGATC 
ACCGTGGACA CCACCCCATA G

Protein sequence

MHTRAVELTE VRTDDDAGTF TGLAAGYDNV DTHGTVLQRG AFASSLAGGG VVPLFWEHGH 
DDPRAIVGEV TAAVETTRGL EIVGKLDTDT ERGAAAYRAV KGRRIRGLSV GMRPTQRRGA 
SIIAADLCEI SLVMRPSNSR ALVESVRSAD DALQTRAASA VATFETIAKD TTMTEPITTE 
RRDELVAETR GLVAAAQGRT LTAEEVATIE TNTETIRRHD EQALETRNDA QAANIARALG 
QAIDTRSGGR QSPFMLSADN VTTLETARKR FENITVLETR AALATTDMGT AREYGPNGLQ 
APRSLWRSAG IPTTAPDGYS GVVPQFTLPG GAVLVGEGVD HQEFDGVNPD AVTIGRAGAW 
STLTSEALLS TSITEVSAAH ARIIARNVDR ATVAKIEDAS PDTMSIDQAL VTVAAECACD 
VSDLWIVGAP AAVAALVGNA TFTPANGGDA ESYASRYGGA AVYPTTSATA DTLTVFHPQS 
FRAFASPLSS GVFVDPKSGK QDFGQWMFYG LGQALVGAAI TVDTTP