Gene Mkms_0820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_0820
Symbol
ID	4614840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	881141
End bp	884512
Gene Length	3372 bp
Protein Length	1123 aa
Translation table	11
GC content	62%
IMG OID	639790496
Product	hypothetical protein
Protein accession	YP_936826
Protein GI	119866874
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.909605
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.0446039
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTAT CGGACTGGTT GAGCGATACG GACTATCACT GGCGGCAACG CCTGCAGCCG 
GTAAACCTCG TCATCGAAGC AAACTTTTCG ATAGATGAGG TGCGCCACGC ACAGCAGCGA 
TATGGAGCAG CGGCGAGACA GCTCTTTCTG CGAGGCGTGC CCTACCGGAA ATTCATTCGG 
CGGTACCCAG CACTCACATT GTTGGTACTT GTCGGCCATG CCGCGCTCGA GTACGACCAA 
GGGAAGTACT GGGACAGCTT CTGGGATGAG CTCGGGATTC CACGCGACGC CGATTTCGAG 
ACGGAGATCA GGAAGAATCT ATTCGACCTG CTCGACAAAT TCTCGCTCGC CCGCTTTCCG 
CGAATCGAGG AGGCATCGAC ATTTAGATAC GTGATGACGT TGACCCTCCA TGCCGGAATC 
CCGGTGCACT GCCTTGGCGA TCTCCTCAGA GTGATCAACG ATCACATCAG GCAAGGCCGG 
GCACCCCATG GTGCCGCACT GATCGAGTGG TTGGAAGAGC CAGGAAAAGA ACACCGTATC 
GATCCACTCG ACGTGCCCGT CCGAAACTTC ATCGCGAACG GCGCTCAGTT CGCCGTCGAC 
ATCCTCGACC GAATCATCGA ATTGGTGCAG GAAGTCGCAG CGAATACAGG TCTGCTCGAC 
GCCGACCTCG ATGCCTCTAC GACAGGCTTG CCCGACGTCC TCCTCGACGA GCTCATCAAG 
CAACTGCGCG ACGCCCCGCC GACATCGCAA GGGAGGAGGC TGACTGGGCG CCACAACCGT 
CAACCATCAA TCGAATACAA CGTCGACGAT GACGAGATCG TGCTGGTGCT ACCGACTCCG 
GAGACCGATG TCGATCTCCC CTGGCGCGTG TCGTTCGACG GTGACGTCCG CCAGGTGCAC 
CCCTCACGCC GGTGGGGTGG TGACGCCATG TCGGCCCAGG TAGCGGTTCC CGGGCCAGTC 
CGCGAGATCG TGGTAGCCCA TCCCAGCGGA GTGAATTCGG CACTTCCGCT CGTGATGAAG 
TCCGACCCAC TGCTGACCTT CGACAAGTCC GGCCGGTGGA TTCCCCGACG AGACGGCTTG 
AAGGAATCCG TGTGGGCGGT CTTCCCTGAA GAGTTCCAGC TGGCCGACAC CCGGGCACAC 
CAGGCTGTCG ACGCCCAGGA CTCTGGATCC CCAGCCGGAT GGCGTGGGTG GCGCAGCGCC 
TTCATCGACC TCACCGAAAT CACGGCACTG CAGCTCCTCA CCTCCGACCG AGTTGCGATC 
GGTACACCGC ACTCGGTTCG CAAAGATGCG AGGCCATCAT TCTTGCTCGG ATCCCCCGTC 
GTAGGTGTGT CCGCACTCGA TGGGCGGACG GTGTATAACA CGCGTCCATG GGTCCTGCTG 
CCTCCGTCGC AGACCGATCC CGCGCCCGAG TGGCTCGTAC GGGTGAGGCA CTTCGGGGCG 
TCGGAATGGA TCGTCGAGGA GAGCTGGCGC GCGGAGGAAA TCGAAACCTG TGTCGACCCG 
TTCGACGACG ACGAGAACCC GCAGCTGGGC CTCTTTGAGA TTGTCGTGAA CGGCCCACTG 
GGCGCTGATG CGCGCTATGT GGTGTTCATG GCGGAAGGCT TGCACATTGA CTTCGATACC 
CCGATTCGCG TGCCCGGTCG GGAAGGGCTG ACGCCCTGCA CCGCTGAGGT AACAGCTGAC 
CATCTTGCGG TGTCCCCTTC AGAACCGTTG CGCTTCGGCC CACGTCAACT GGAGCAGCAG 
ATCAGGCTGC AGTCAGGAGA CCTCGAGTCG AGGATCGCGG TCAGACCGCC CCACGTTGAG 
ATCCGCGCGG GCGTGTCCGG CGAACCAGCA GCGTGGAGGA TGACCCCCGA GGTCTGCGAT 
CCTGCCGACT TCGCCGAAGA CCGCTTCGCC GCGATACGTG TTCCGGGCAT CGATCACGTC 
CAGTTCGCAT ACATCTCATC GCACGGCGAT CTGCTTCAAC GCGATCCGAA CTCGCGAAGG 
CGCCACGGCG ACGTCGTCGA GTCGCGAATC CAGCAGTTCG CAGACACAGT GCGAAACAAC 
CCGGGCGGAC GGGTTGTGGC GACGCTTTCG ACGCACGCCG GCCCCCTCGA CGTGACCGTA 
CTCTTCGCAT ATCCCCGACG ACTGGCCTCG GGCGTCCAGC TCCACGAGGA CACGTTGAAA 
TTTTTCGAAA CTCCCGCCCT TGACGATCTG GCGGTGTATG TCTGGAGCAG CACCGCGCCC 
TGGCGGGCGC CCGAAGTTCT GCCGGTCTCA GACGGAATGG CCGCTCTCCC TCCTGCTTTG 
GTCGACGCCG GGGATCTGCG GTGCCAGTTG TTCATCGACG ACCCTTGGGT GTTGATCGAG 
CCGCCACCGA TGCCACCCGC GAGCGCTTTC GTCGTAGAGC AAGTCGGCTG GCGCGAGGAC 
GGTACACCGA GCCAGGTGAA GCTCTCGCGG TATCTCGGTA CACAACGCTC AGCGCCCATC 
GAAGTAGGCG CGATCCCCGA GGTGTGGGCG GCCATGGCAC GGCTCCACGC AGACGGCAAG 
GCAGAACGCT TCGATGGGCT GACGCAAGTT TTGGCCGTCG ATCCCCGTTT CGCTCTGGAA 
CGCCTGGGCA ACAGCATGAT TCCCGCTGGC GACAAGATGG CCATGCTCAT TCGCAGTGAG 
TTGGTCAACC ACGATTTCTC CGCGGAGGAA ACCCTCAACG ACCTACACGC CCACCCGTGG 
TTCGGTTGCA TGGTCGAGCT CGCCGACCTG CCGTCCCTAC ACAACCGCCG TGAGCAAGTG 
CGAGACGAGC GCGCGCAGAC ACTTGCCTAC CTCCAGGACC GAGGTGGGGT GCCTCTGATG 
GATCTGCTGC GAACCGGCAC GAACGACCAC GCTTTCGGGG CGTGTTTCGA CGGCAACGTG 
TTCCGTTGGA CTGAGATACC GGGCAACCGA ATCGAAGAGA AGCTGCGTGA AATCCAGCAG 
ATCCCCCTCG CGCAACTGCA TCACGACAAC CTGCGCGCAG GGGTGTACGA AGCGTTCTGC 
CGGCGCAGCG AGTGGCTCGC ATCAGGCTGG ACCGCACACT TCGCCATGCA AACAGGATTG 
GTGGCCACGC CGATCAGACA CGCCTCACTG CTTGCTCACG AGGCGGTAGT GACCCGCCAC 
GACCGCGTCC GAAAGATCGA CGCTTCAGCG AATCCCTGGA TTCTCATGTC GGTGGAGTCG 
CTGACCTTGG CGCTACTGGC TCGGCTCGAA GCTCATGGAC GAATCGACGG CCGGTACCTC 
GATCGTGGAC TGTTACGGAC GTGGTCCCGC ATGGCGAAGC TCTGCCCGAC CATGGTGGCG 
AACGATCTGT TGATCGCCGA AGCCGTTGTG CTGTATGACC GGCGCGGCGA CCTCACTGGA 
GAGGACACAT GA

Protein sequence

MSLSDWLSDT DYHWRQRLQP VNLVIEANFS IDEVRHAQQR YGAAARQLFL RGVPYRKFIR 
RYPALTLLVL VGHAALEYDQ GKYWDSFWDE LGIPRDADFE TEIRKNLFDL LDKFSLARFP 
RIEEASTFRY VMTLTLHAGI PVHCLGDLLR VINDHIRQGR APHGAALIEW LEEPGKEHRI 
DPLDVPVRNF IANGAQFAVD ILDRIIELVQ EVAANTGLLD ADLDASTTGL PDVLLDELIK 
QLRDAPPTSQ GRRLTGRHNR QPSIEYNVDD DEIVLVLPTP ETDVDLPWRV SFDGDVRQVH 
PSRRWGGDAM SAQVAVPGPV REIVVAHPSG VNSALPLVMK SDPLLTFDKS GRWIPRRDGL 
KESVWAVFPE EFQLADTRAH QAVDAQDSGS PAGWRGWRSA FIDLTEITAL QLLTSDRVAI 
GTPHSVRKDA RPSFLLGSPV VGVSALDGRT VYNTRPWVLL PPSQTDPAPE WLVRVRHFGA 
SEWIVEESWR AEEIETCVDP FDDDENPQLG LFEIVVNGPL GADARYVVFM AEGLHIDFDT 
PIRVPGREGL TPCTAEVTAD HLAVSPSEPL RFGPRQLEQQ IRLQSGDLES RIAVRPPHVE 
IRAGVSGEPA AWRMTPEVCD PADFAEDRFA AIRVPGIDHV QFAYISSHGD LLQRDPNSRR 
RHGDVVESRI QQFADTVRNN PGGRVVATLS THAGPLDVTV LFAYPRRLAS GVQLHEDTLK 
FFETPALDDL AVYVWSSTAP WRAPEVLPVS DGMAALPPAL VDAGDLRCQL FIDDPWVLIE 
PPPMPPASAF VVEQVGWRED GTPSQVKLSR YLGTQRSAPI EVGAIPEVWA AMARLHADGK 
AERFDGLTQV LAVDPRFALE RLGNSMIPAG DKMAMLIRSE LVNHDFSAEE TLNDLHAHPW 
FGCMVELADL PSLHNRREQV RDERAQTLAY LQDRGGVPLM DLLRTGTNDH AFGACFDGNV 
FRWTEIPGNR IEEKLREIQQ IPLAQLHHDN LRAGVYEAFC RRSEWLASGW TAHFAMQTGL 
VATPIRHASL LAHEAVVTRH DRVRKIDASA NPWILMSVES LTLALLARLE AHGRIDGRYL 
DRGLLRTWSR MAKLCPTMVA NDLLIAEAVV LYDRRGDLTG EDT