Gene Mkms_3838 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3838
Symbol
ID	4611773
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	4054193
End bp	4055461
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	68%
IMG OID	639793518
Product	peptidase M24
Protein accession	YP_939821
Protein GI	119869869
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACGT CGACTCACAC CGGCGTCACC CAGATCGCCC GGACCGGGTA CACGTGGCTG 
GACATCCCGC AGGAGCCCGA CTTCACCCGG CTGCGCAGTG AGGTCGGTGC ACGTCTGCAC 
GCCGCGATGG CCGAACAGGG TGTCGACGCG CTGGTTCTGC TGGGCAACGG AAACGTCATG 
TACGCCACCG GTATCAGCTG GCCGCTGGCC GATGCCGGCC TGTCACACGT CGAGCGGCCG 
GTGGCGGTCG TGCTGGCCGA CGACGAGCAC CCGCACCTGT TCCTGCCCTT CCGCGAGGGT 
GCGGCGATGG AGTCGGACCT GCCCGACGAC CACCTGCACG GGCCGGTCTA TCTGGAGTTC 
GACGAAGGCG TCGCCGAATT CGCGAAGATC CTGGCCCGCC TGATCCCGGC CGGCGCGACA 
GTCGCGACCG ACGAGTTGAC CGGGGCGATG CGGCGGGCCG GCAGCGCGCT GTTCCCCGAC 
GCGCCGATCG ATGCGGCCCC GGTGATCGGC GCGGCCAAGA TCGTGAAGAC CATCGACCAG 
ATCGCCTGCA TCCGGCGGGC GTGTCAGATC ACCGAACAGG CCGTCGCCGA GATCCAGAAA 
TCGCTCGCCC CGGGTGCGCG TCAGATCGAC CTGTCCGCCG AATTCGTGCG CCGCACCTTC 
GAACTCGGCG CCACCACCAA CATGTTCGAC TCGATCTGGC AGGCCATGCC GGCGTCGAAG 
GCCGAGGGCA CCTGGACCAC CACCGGCGAT CTGGCCCTGC CCCTGCTGAC GACCGAACGT 
GAGATCCAGC AGGGCGACGT CCTGTGGACC GACGTGTCCA TCGCCTACCA GGGCTATTGC 
TCCGATCACG GACGCACCTG GATCGTCGGT CAGGATCCGA CGCCGGCCCA GCAGAAGCAG 
TTCGACAGGT GGAGCGAGAT CGTCGACGCG GTGCTCGCGG TGACCAAGGC CGGTGCGACC 
TGCGGCGACC TCGGGCGCGC GGCCACCGCG GCAGCGGGCG GTCAGAAGCC GTGGCTGCCG 
CACTTCTACC TGGGCCACGG AATCGGAACC AGCGCGGCCG AAATGCCGAT GATCGGAACG 
GATCTCGGTC AGGAGTGGGA CGACAACTTC GTCTTCCCGG CCGGCATGCT CCTGGTGTTC 
GAGCCGGTGG TCTGGGAGGA CGGCACCGGC GGCTACCGGG GCGAGGAGAT CGTGGTCGTC 
ACCGAGGGCG GCTGGATGCC GCTGACCGAG TATCCCTACG ACCCGTACGA GGTGACCCGT 
GGGAATTGA

Protein sequence

MTTSTHTGVT QIARTGYTWL DIPQEPDFTR LRSEVGARLH AAMAEQGVDA LVLLGNGNVM 
YATGISWPLA DAGLSHVERP VAVVLADDEH PHLFLPFREG AAMESDLPDD HLHGPVYLEF 
DEGVAEFAKI LARLIPAGAT VATDELTGAM RRAGSALFPD APIDAAPVIG AAKIVKTIDQ 
IACIRRACQI TEQAVAEIQK SLAPGARQID LSAEFVRRTF ELGATTNMFD SIWQAMPASK 
AEGTWTTTGD LALPLLTTER EIQQGDVLWT DVSIAYQGYC SDHGRTWIVG QDPTPAQQKQ 
FDRWSEIVDA VLAVTKAGAT CGDLGRAATA AAGGQKPWLP HFYLGHGIGT SAAEMPMIGT 
DLGQEWDDNF VFPAGMLLVF EPVVWEDGTG GYRGEEIVVV TEGGWMPLTE YPYDPYEVTR 
GN