Gene Mkms_3107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3107
Symbol
ID	4610942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	3252181
End bp	3255045
Gene Length	2865 bp
Protein Length	954 aa
Translation table	11
GC content	71%
IMG OID	639792778
Product	prolipoprotein diacylglyceryl transferase
Protein accession	YP_939091
Protein GI	119869139
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG0682] Prolipoprotein diacylglyceryltransferase [COG5271] AAA ATPase containing von Willebrand factor type A (vWA) domain
TIGRFAM ID	[TIGR00544] prolipoprotein diacylglyceryl transferase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.851617
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGAGCA CGCTGGCCTA CATTCCCAGT CCGCCGCAGG GCGTGTGGGA GCTCGGGCCG 
TTCCCGCTGC GCGCGTACGC GCTGTGCATC ATCGCGGGCA TCATCGTCGC GTTGGTCCTG 
GGCGACCGCC GCTGGGAGGC GCGCGGCGGC GAGCGCGGCG TCATCTACGA CATCGCCCTG 
TGGGCGGTGC CGTTCGGGCT GATCGGTGGC CGGCTCTACC ACGTCATCAC CGATTGGCAG 
ACGTACTTCG GGCCCGACGG CGCCGGGCTG ATCGCGGCGT TCCGCATCTG GGAGGGCGGC 
CTTGGCATTT GGGGCGCGGT GGCGCTCGGC GGGGTCGGGG CCTGGATCGC CTGCCGTCGT 
CGCGGCATCC CGCTGCCCGC CTTCGGCGAC GCCATCGCGC CCGGCATCAT CCTGGCGCAG 
GCGATCGGCC GGCTCGGCAA CTACTTCAAT CAGGAGCTCT ACGGCCGCGC GACGACGGTG 
CCGTGGGGGC TCGAGATCTA CGAGCGGGTC GATGCCAGCG GTGCGCGCAA TGACCTGATC 
GGGGTGTCGA CGGGCCGCGT CATCGAGATC GTGCACCCCA CCTTCCTCTA CGAATTGGTG 
TGGAACCTGC TGGTTTTCGC GGTTCTCATC TGGGCGGACC GGCGGTTCAA CCTGGGGCAC 
GGCCGGCTGT TCGCGCTGTA CGTCGCGGGC TACTGCCTCG GCCGGTTCTG GATCGAGCTG 
CTGCGCAGTG ACATGGCCAC CGAGCTGGCG GGTATCCGGG TCAACTCGTT CACGTCGATG 
TTCGTGTTCA TCGGAGCCGT GGTGTACCTG ATGGCGGCTC CGCGCGGCCG GGAGGACCCC 
GCGACGCTTC GGAGTGACGT GGATGAGGAG GTCGAAGCCG CGGCCGTCTC GCCGAACGAT 
TTCGAGGCCG ATGCGGTCGA ACCCGGCGAC ACCGACGAAG ACGACGCTGC GACCACAGCG 
CTGCTCAAAG AGGCCGCGGC CGCCACGGGT GTGGGGGTCG CCGCGAAAGT CGCGGGGGAC 
GACGACGCGA AGGACGAGGA CGTCCAGTCC GACACGGCGG AGCCGGTCGC CGAGGCCGAG 
GCGTTGGCTG AGGATGTCGA GTCGGCGCCG TCGGAGGACA TTGCCGAGGC GGTGGCGTTC 
GCGGACGCTG GTGAGGCCGC GGATCGTGAG CCGTTGACGA CGGCCGGTGT CGTTGAGGGT 
GAGGACGCGG TCGCGGCTGA GGAGTCGGCT GAAGAGGCGC ATGCGGCGGC GGTCGAAGGC 
GCCGAAGAAG CCGAAGCGGT CGCCGAGGAA GTCGCTGCTG AGGACAGGGC CCAGGAGACG 
CCCGCCGAAG CGCCGAGTGT GAAACCTTCG CGATTCTTGG GACGACTTTT CGCGAGAGCT 
TCACGCTCGG TGAAGCCGGA GCCCGCGGAA GCGGGCAAGG CTGCTGATCG TGAGCCGTTG 
ACGACGGCCG GTGCTGCCGA CGGCGGGCCC GATGAAGAAA TGCCGGAGCC GGTAGCCGAG 
GCGGAGGCAC TGGCGGAGGA CGTCGAGTCG GCGCCCTCGG AGGACATCGC TGAGGCGGTG 
GCGTTCGCGG AAGCCGGTGA GGCTGCCGAT GAGGAGCCTC CGGTCACTGT CGGTTCGGTC 
GAGGGTGAGG ATGCGGTCGC GGCTGAGGAG TCGGCCGAGG AGGCGCATGC GGCGGCGGTC 
GAGGGTGCCG CGGAGGCCGA GGCGCTCGCC GACGAAGTCG CTGTTGCGGA TGCTGGCGAG 
CCCGAGTCCC AGCCGGAGCC GGTGCCCGAG GTCGAGGCTG GTGAGGCGGC TGATCGTGAG 
GCGTTGACGA CCGCTCGTGT CGTTGAGGGT GAGGACGCGG TCGCGGCTGA GGAGTCGGCC 
GAGGAGGCGC ATGAGGCTGC GGTTGAGGGT GCCGCGGAGG CCGAGGCGCT CGCCGACGAA 
GTCGCTGTTG CAGATGCTGG CGAGCCTGAG CCTGAAGGCG AGCCGGAGTC GGTGGCGGAG 
CCTGAGGCGG TTGCCGACGA GGTCGCCGAT GACACGGCGG AGCCGGTGGC CGGGGTCGAG 
GCTGGTGAGG CTGGGGATCG TGAGCCGTTG ACGACGGCCG GTGCGGTTGA GGGTGGCGCG 
GAGGCTGAAG CGCTCGCCGA CGAAGTCGCC GGTGACATGG CGGAGCCGGT GGCCGAGGTC 
GGGGCTGGTG AGGCGGCTGA TCGTGAGGCG TTGACGACGG CTGGTGCGGT TGAGGGTGAG 
GACGCGGTCG CGGCTGAGGA GTCGGCCGAG GAGGCGCATG AGGCTGCGGT TGAGGGTGCC 
GCGGAGGCTG AAGCGCTCGC CGACGAGGTG GCTGCCGCGG AGCCCGAGGC GTTGGCCGAG 
GATGTCGAGT CGGCCCCGTC GGAGGACATC GCTGAGACCG CAGCGTTCGC TGACGCTGGT 
GAGGCGGCCG ATCGTGAGCC GTTGACGACC GCCGGTGCGG TCGAGGGTGC CGAGGAGGCC 
GAGGCCGTCG CCGAAGGGGG GCTCGACGAG GACCTCGAGG CGGCAGTGGA ACGGGCCGAC 
GAGGCCGAGG CGGTCGCGGA GGAGATCGCC GTCGCCGACG CCGAAGGGCA GTTCGCCGAC 
GACGAGCCCG TGGAGGACCG GGACGCCGAA GCCGTCGCCG GAGAGGTCGG CGCCGCCGAA 
GCGGAGGCGC TCGAAGACTC GGCCGTCGAG CAGGAGACCG CGCCCGACGA GACCGCCGAA 
CCGGTCGTCG ACGACGAAGA GTTGGCGGCA AGTGCGCAGG ATGCGCCTGG CGACGACGTC 
GCTGACATCG ACGAGGGCGG TGAGACCGAC GCGTCCGCCT ACCGGATCAT CACGACCCCC 
GAACCGGTTC CGACACGTCG CCGGTGGTTC CGCCGCCGCA AGTGA

Protein sequence

MTSTLAYIPS PPQGVWELGP FPLRAYALCI IAGIIVALVL GDRRWEARGG ERGVIYDIAL 
WAVPFGLIGG RLYHVITDWQ TYFGPDGAGL IAAFRIWEGG LGIWGAVALG GVGAWIACRR 
RGIPLPAFGD AIAPGIILAQ AIGRLGNYFN QELYGRATTV PWGLEIYERV DASGARNDLI 
GVSTGRVIEI VHPTFLYELV WNLLVFAVLI WADRRFNLGH GRLFALYVAG YCLGRFWIEL 
LRSDMATELA GIRVNSFTSM FVFIGAVVYL MAAPRGREDP ATLRSDVDEE VEAAAVSPND 
FEADAVEPGD TDEDDAATTA LLKEAAAATG VGVAAKVAGD DDAKDEDVQS DTAEPVAEAE 
ALAEDVESAP SEDIAEAVAF ADAGEAADRE PLTTAGVVEG EDAVAAEESA EEAHAAAVEG 
AEEAEAVAEE VAAEDRAQET PAEAPSVKPS RFLGRLFARA SRSVKPEPAE AGKAADREPL 
TTAGAADGGP DEEMPEPVAE AEALAEDVES APSEDIAEAV AFAEAGEAAD EEPPVTVGSV 
EGEDAVAAEE SAEEAHAAAV EGAAEAEALA DEVAVADAGE PESQPEPVPE VEAGEAADRE 
ALTTARVVEG EDAVAAEESA EEAHEAAVEG AAEAEALADE VAVADAGEPE PEGEPESVAE 
PEAVADEVAD DTAEPVAGVE AGEAGDREPL TTAGAVEGGA EAEALADEVA GDMAEPVAEV 
GAGEAADREA LTTAGAVEGE DAVAAEESAE EAHEAAVEGA AEAEALADEV AAAEPEALAE 
DVESAPSEDI AETAAFADAG EAADREPLTT AGAVEGAEEA EAVAEGGLDE DLEAAVERAD 
EAEAVAEEIA VADAEGQFAD DEPVEDRDAE AVAGEVGAAE AEALEDSAVE QETAPDETAE 
PVVDDEELAA SAQDAPGDDV ADIDEGGETD ASAYRIITTP EPVPTRRRWF RRRK