Gene Mkms_0031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_0031
Symbol
ID	4615598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	34576
End bp	35811
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	58%
IMG OID	639789708
Product	type I restriction-modification system specificity subunit
Protein accession	YP_936040
Protein GI	119866088
COG category	[V] Defense mechanisms
COG ID	[COG0732] Restriction endonuclease S subunits
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.404176
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.032892
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTGT GGCGGGAGTC TGTGCTCGGA GATCTATGCA CGAGAGTGAC GGTCGGGCAC 
GTCGGAAAGA TGGCCACCGA GTACGTTCCG GACGGCGTCC CTTTCCTCCG GTCACAAAAC 
GTGCGGCCTT TCGTGATTGA CAAGCGCGGC TTGCTCTACA TCGGTGACGA CTTCAACGCA 
AAGCTGCGCA AATCGGCGCT CACTGCGGGT GACGTCGTTA TCGTCCGCAC GGGATATCCG 
GGAACGGCAG CTGTCGTCCC CGAGGATCTT GATGGATCCA ACTGCGCCGA TCTTGTTGTC 
ATTACACCGT CAGACGCATT GAATCCTCAC GTGCTTGCAG CGCTCTTCAA CTCGGTCTAC 
GGGCAGCACG CGGTCAGTTC GCAATTAGTT GGCTCTGCGC AACAGCACTT CAACGTTGGC 
TCGGCCAAGA CGATGCGGGT CCGACTGCCC GATCGTGCTG AGCAGGACCA CATCGCAGCA 
GTCCTCTGTT CGATCAATGA CTTGATCGAA AACAACCGAC GACGTGTGGA GGTTTTGGAG 
GGGATGGCGC GGACCATCTA CCGCGAGTGG TTCGTGAAAT TCCGCTACCC AGGCAACGAA 
GGCGTCCCTC TTGTCGACTC TGCGCTGGGC CCAGCACCGA AGGGGTGGGA AGTCGCGAAT 
CTATTCGACG CTGCTGACGT CGGCTTTGGG TACTCATTCA AGTCTCCCCG GTTTTCGAAT 
TCTGGTCCAT TCCAGGTGAT TCGGATCCGC GACATCCCAG TCGGCATCTC AAGGACATAT 
ACCGATGAAG CAGCAGATCC GCGCTACGCC GTCTATGACG ATGACGTGCT TATAGGTATG 
GACGGTGACT TCCACATGAC GGTCTGGACT GGTGAAGACG CGTGGCTGAA CCAGCGAGTC 
ACCCGCCTTC GCCCGAGGCT CGGGCTGTCC GCGCTTCATC TATTGCTCGC GATCGAGGAG 
CAGATCAAAG ACTGGAACCG CGCAATTGTT GGCACGACTG TGGCGCATCT AGGTAAGAAG 
CATCTCCAAC TTGTCAACGT CCTCGTGCCG AATGATGCAG TACGCATAGA CGCATCTGTC 
GTGTTTGCGC CCATCATGGA GGAGCGTCGT GCGCTCATCC AATCAAGTCG GCGGCTCGCC 
GCTCTTCGCG ACCTCCTGCT TCCGAAGCTG GTCAGCGGAC AGATCGACGT TTCCGCACTC 
GACTTGGATG CAGTGGTTGG AGAACAGGTG GCGTGA

Protein sequence

MTVWRESVLG DLCTRVTVGH VGKMATEYVP DGVPFLRSQN VRPFVIDKRG LLYIGDDFNA 
KLRKSALTAG DVVIVRTGYP GTAAVVPEDL DGSNCADLVV ITPSDALNPH VLAALFNSVY 
GQHAVSSQLV GSAQQHFNVG SAKTMRVRLP DRAEQDHIAA VLCSINDLIE NNRRRVEVLE 
GMARTIYREW FVKFRYPGNE GVPLVDSALG PAPKGWEVAN LFDAADVGFG YSFKSPRFSN 
SGPFQVIRIR DIPVGISRTY TDEAADPRYA VYDDDVLIGM DGDFHMTVWT GEDAWLNQRV 
TRLRPRLGLS ALHLLLAIEE QIKDWNRAIV GTTVAHLGKK HLQLVNVLVP NDAVRIDASV 
VFAPIMEERR ALIQSSRRLA ALRDLLLPKL VSGQIDVSAL DLDAVVGEQV A