Gene Mkms_1116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_1116
Symbol
ID	4614494
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	1201726
End bp	1203003
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	68%
IMG OID	639790792
Product	hypothetical protein
Protein accession	YP_937119
Protein GI	119867167
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACT ACTGGCTGAA CGTGGCCCTG GTATTCGCGC TCATACTGGT CAACGGGCTG 
CTGGCGGGAA GCGAAGCAGC GTTCATCTCC CTGAGAGAGG GTCAGCTGCG CGAGCTGGAA 
CATCGCGGCG GCCGACGGGA TCTCACCGTC GTCGGGTTGG CCCGAGAGCC GAACCGCTAC 
CTCGCCACCA TCCAACTGGG CATCACCCTG GCCGGATTCT TCGCCTCGGC CACCGCGGCG 
GTCACCCTGG CGGAGCCGCT GGCCCCGCTG CTGGGCTTCC TGGGCGCCGG TGCACAGACG 
GCGGTCAGCA TCGCGGTGGT GACGGTGCTG GTGGCCGGTG TGACCCTCGT GTTCGGGGAG 
CTCGCGCCCA AGAGGCTGGC GATGCAGTAC GCCCGGCGGT GGGCACTCGT CGTGGCCTCA 
CCGTTGAGTG CCATGTCGGC CGTCGCCGCA CCGATCGCGT GGGTTCTCGG CAGGGCCACC 
GACCTCGTCG TGCGGATTCT CGGGGGAGAT CCCGCCGTCG GGCAGGAAGA GCTCACCATC 
GAGGAGTTCG GGCAACTGAT CACCGGTCTC GGCGGCCTGA CCGCCGAACA ACGCACGATC 
CTGTCCGGTG CGCTGGAGAT CCACGAGCGT TCACTGCGCG AAGTCATCGT CCCCCGGACG 
GCGGTCTTCC GGCTGAACGG TGAGCTGTCG CTGCAGCGGG CTCGCACGGA CCTCGCGGCG 
TCCGGCCACA CCAGGGCGCC GGTCGTGCGA TCCGGAGAAC TGGACGACGC CATCGGTGTG 
GTGCACCTGC GCGACCTGCT GGGTGACGAC GGCACCGTCG CCGAAGTCAC CCGACCGGTG 
CTCAGACTGC CGGACAGTCT GCGCGTCACC ATCGCGCTGC GCCAACTGCT CGCCGCGCAC 
GAGCATCTGG CGCTCGTCGT CGGCGAGCAC GGCGGCGTCG ACGGCATCGT CACCCTCGAG 
GATCTGCTCG AGGAGATCGT CGGCGAGATC TACGACGAGG CCGACGAGGA CATCCGAACC 
GCCGAAGCAC TCCCGGACGG CAGTCGAATT CTGCCGGGCA CCTTCCCGAT TCACGATCTG 
CCCGACATCG GGATCGAGTT CTCCGACGCA CCTCCCGGCG ACTACACCAC GATCGCCGGA 
CTCGTGCTGT CCCTGCTGGG GCGGATTCCG ACGGTTCCCG GAGATCGCGT CGACCTTCCG 
CCTTGCCGTG TCCAGGTCAC AGGCGTCGGC CGCCATGCGA TCACCGAGGT GCGCATTCTG 
CCTCGAGATC GGCGATGA

Protein sequence

MSDYWLNVAL VFALILVNGL LAGSEAAFIS LREGQLRELE HRGGRRDLTV VGLAREPNRY 
LATIQLGITL AGFFASATAA VTLAEPLAPL LGFLGAGAQT AVSIAVVTVL VAGVTLVFGE 
LAPKRLAMQY ARRWALVVAS PLSAMSAVAA PIAWVLGRAT DLVVRILGGD PAVGQEELTI 
EEFGQLITGL GGLTAEQRTI LSGALEIHER SLREVIVPRT AVFRLNGELS LQRARTDLAA 
SGHTRAPVVR SGELDDAIGV VHLRDLLGDD GTVAEVTRPV LRLPDSLRVT IALRQLLAAH 
EHLALVVGEH GGVDGIVTLE DLLEEIVGEI YDEADEDIRT AEALPDGSRI LPGTFPIHDL 
PDIGIEFSDA PPGDYTTIAG LVLSLLGRIP TVPGDRVDLP PCRVQVTGVG RHAITEVRIL 
PRDRR