Gene Mkms_3633 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3633
Symbol
ID	4611563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	3824575
End bp	3826575
Gene Length	2001 bp
Protein Length	666 aa
Translation table	11
GC content	72%
IMG OID	639793309
Product	peptidase S9 prolyl oligopeptidase
Protein accession	YP_939617
Protein GI	119869665
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1506] Dipeptidyl aminopeptidases/acylaminoacyl-peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.656899
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGACA CTGTCTCGCC GTTCGCGGAG CTCGACGCCT ACCTCGCACT CCCACGGGTG 
GCCGGGCTCG CCGTGTCTCC CGACGGGTCG CGGGTGGTGA CCACGATCAG CGAGCTCGAC 
GACAAGCGCA CCGCGTTCGT CACCGCGATC TGGGAACTGG ACCCCGCCGG GAGGCGCCCC 
GCCCGCCGCC TCACCCGCGG CGCGAAGGGG GAGCGGGCGC CGGCGTTCAC CCCGGGCGGA 
GATCTGCTGT TCCTCGCGTC GCGCCCCACC GGGGATTCCG CCGAGGACGG GGACTCGCCG 
CCCGCGGCGC TGTGGCGGCT GCCCGCACAG GGCGGGGAAG CGGTCGAGGA ACTCACCCCG 
CCCGGCGGTG TAACGTCCGT GCGCTGCGCC CGGGCCGCGG GGGTCGCGGT GGTGAGCGCG 
CCGATGCTGG TCTCGGCCGC CGACCTCGAC GACGACAAGA GGCTGCGTGC GCTGAGAAAG 
GACAACAAGG TCTCCGCGGT CCTGCACAGC GGGTATCCGG TGCGCTCCTG GGATCACGAC 
CTCGGACCCG ATCAGCCGCA TCTGCTCGAC GCCGCCGACG GCCGCGACCT CACACCCCGA 
CCGGGCGGCG GTCTGCGCGA CGCCGCCGTC GACGTCAGCG ACGACGGCAG CTTTCTCGTC 
ACCTCCTGGC AGAACCCGTC CGCCGGGGCG GCGCTGCGCG ACACCCTGGT ACGCGTCGAG 
GTCGGCAGCG GTGAGCGCAC CACGGTCGCC GACGACCCCG GGGCCGATCT GGGCCATCCG 
GCCATCTCCC CGGACGGCCG GATGCTGGCG TTCACCCGCG AGACGATCTC CACTCCGCTG 
CAGGCCCCGC GAATCACATT GTGCTGCCTG CATTTCGGTG GTGAGGTGCG CGAACTGACA 
GCCCACTGGG ACCGGTGGCC GACATCGGTC ACCTGGAGCC GCGACGGCGC GAAACTAATC 
GTCACCGCCG ACGACAACGG CCGCGGGCCG ATCTTCCTGA TCGACCCGGA CACCGGCGCT 
GTCACCAAGC TGACCGACGA CGACCACACC TACACCGACG TCGTCACCGC ACCCGGCGGT 
GTGCTCTTCG CGATCCGCCA CAACTACGCC GCCCCACCGC ACCCGGTGCG CATCGACCCC 
GACGGCACCG TCACCGTCCT GCCGACCGTC GACGCCCCGA GGCTGCCGGG CACGCTGAGC 
GAGATCACCG CCACCGCACC CGACGGCGCC GCCGTGCGGT CCTGGCTGGC CCTGCCCGAC 
GGCGCCGGCG AGAACGCCCC GGCGCCGCTG CTGCTGTGGA TCCACGGCGG ACCGCTCGCC 
AGTTGGAACG CCTGGCACTG GCGGTGGAAT CCGTGGCTGA TGGTCGCGCA GGGCTACGCC 
GTGCTGCTCC CCGATCCGGC CCTGTCCACC GGCTACGGCC AGGACTTCAT CCAGCGGGGC 
TGGGGCGCCT GGGGCGAGGC GCCCTACACG GATCTGATGG CCGCCACCGA CGCGGCGACC 
GCCGACCCGC GCATCGACGG CACCCGCACC GCGGCGATGG GTGGGTCGTT CGGCGGATAC 
ATGGCCAACT GGATCGCCGG GCACACCGAC CGGTTCGATG CGATCGTCAC CCACGCCAGC 
CTGTGGGCGC TCGATCAGTT CGGTCCCACC ACCGACGGCG CGTACTGGTG GGCGCGCGAG 
ATGACACCCG AGATGGCCGA ACGCAATTCA CCGCACCTGT TCGTGGAGAA CATCGCCACG 
CCGATGTTGG TGATCCACGG CGACAAGGAC TACCGGGTGC CGATCGGCGA AGCGCTGCGG 
CTCTGGTACG AGCTGCTCAC CAGATCGCGC CTGCCCGCCG CGGACGACGG CACCGGACCG 
CACCGCTTCC TCTACTACCC CTCGGAGAAC CACTGGGTGC TTGCTCCCCA GCATGCGAAG 
CTCTGGTACC AGGTCGTCTT CGCATTCCTG GCCCGGCACG TGCTCGGGCG GGACGTCGAG 
CTGCCCGAAC TGCTCGGGTA G

Protein sequence

MPDTVSPFAE LDAYLALPRV AGLAVSPDGS RVVTTISELD DKRTAFVTAI WELDPAGRRP 
ARRLTRGAKG ERAPAFTPGG DLLFLASRPT GDSAEDGDSP PAALWRLPAQ GGEAVEELTP 
PGGVTSVRCA RAAGVAVVSA PMLVSAADLD DDKRLRALRK DNKVSAVLHS GYPVRSWDHD 
LGPDQPHLLD AADGRDLTPR PGGGLRDAAV DVSDDGSFLV TSWQNPSAGA ALRDTLVRVE 
VGSGERTTVA DDPGADLGHP AISPDGRMLA FTRETISTPL QAPRITLCCL HFGGEVRELT 
AHWDRWPTSV TWSRDGAKLI VTADDNGRGP IFLIDPDTGA VTKLTDDDHT YTDVVTAPGG 
VLFAIRHNYA APPHPVRIDP DGTVTVLPTV DAPRLPGTLS EITATAPDGA AVRSWLALPD 
GAGENAPAPL LLWIHGGPLA SWNAWHWRWN PWLMVAQGYA VLLPDPALST GYGQDFIQRG 
WGAWGEAPYT DLMAATDAAT ADPRIDGTRT AAMGGSFGGY MANWIAGHTD RFDAIVTHAS 
LWALDQFGPT TDGAYWWARE MTPEMAERNS PHLFVENIAT PMLVIHGDKD YRVPIGEALR 
LWYELLTRSR LPAADDGTGP HRFLYYPSEN HWVLAPQHAK LWYQVVFAFL ARHVLGRDVE 
LPELLG