Gene Mkms_3684 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_3684
Symbol
ID	4611616
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	3883074
End bp	3884693
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	70%
IMG OID	639793362
Product	alpha amylase, catalytic region
Protein accession	YP_939668
Protein GI	119869716
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.942466
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGCAA TGGCTCACCC CCCGACAGCT GACCAGCCCT GGTGGTCGCG CGCGGTGTTC 
TACCAGGTCT ATCCCCGGTC CTTCCACGAC AGCGACGGCG ACGGTGTCGG CGACCTCGAC 
GGCGTGACCG CCAAACTCGA CTATCTGAGT GAACTCGGCG TCGACGCACT GTGGCTCAAC 
CCGGTCACCG TCTCCCCCAT GGCCGACCAC GGCTACGACG TCGCCGACCC CCGCGACATC 
GACCCGCTGT TCGGCGGCAT CGACGCCCTG GACCGGCTCA TCGCCGCCGC GCACGACCGC 
GGTATCCGCA TCACCATGGA TCTGGTGCCC AACCACACCA GCTCGGCGCA CCCGTGGTTC 
CAGGCGGCGC TGGCGGCGGG TCCGGGCAGC GCCCAGCGGG AGCGCTACAT CTTCCGGGAG 
GGCACCGGTC CCGACGGGCT GCTCCCGCCC AACAACTGGA TCTCCGTCTT CGGCGGGCCC 
GCGTGGACGC GGATCGTCGA ACCCGACGGG CAGCCCGGCC AGTGGTACCT GCACCTGTTC 
GACCCGGAGC AGCCCGACCT CAACTGGGAC AACCCCGAGG TCTTCGAGGA TCTCGAGAAG 
ACGCTGCGCT TCTGGCTCGA CCGCGGCGTC GACGGTTTCC GGATCGACGT GGCGCATGGG 
ATGGCCAAAC CGCCGGACCT GCCCGATATG GAGATCGCCG AGAACAGGAT GCTCGCCGAG 
ACCGCCAGCG ATCCGCGGTT CGACCACCAG GGCGTCCACG ACATCCACCG CAACATCCGC 
TCCGTGCTCG ACGACTATCC CGGCGCGGTC GCCGTCGGCG AGGTGTGGGT CTACGACAAC 
GCCGCGTTCG CCGCCTACCT GCGGGCCGAC GAACTGCATC TGGGCTTCAA CTTCCGGCTG 
GTGCGCGCCG ACTTCGACGC CGACGAGATC CACGACGCGA TCGAGAACTC GCTGGCCGCC 
GTCGCCCTGG AAAACGCGAC GCCGACGTGG ACGCTGTCCA ACCACGACGT CGAGCGGGAG 
GTCACCCGGT ACGGCGGCGG GGCGCTCGGG CTGGCGCGGG CCCGGGCGAT GGCCCTGGTG 
ATGCTGGCGC TGCCCGGCGT GGTGTTCGTC TACAACGGCG AAGAACTCGG CCTGCCCAAC 
GTCGACCTGC CCGACGAAGT GCTCCAGGAC CCGGTGTGGG AACGCTCCGA CCGCACCGAA 
CGCGGGCGCG ACGGATGCCG CGTGCCGATG CCGTGGAGCG GTGACGCTCC CCCGTTCGGG 
TTCTCGACGA CGGCCGACAC CTGGCTGCCG ATGCCGGCGG AATGGTCGTC GCTGACCGTC 
GAACGCCAGC TGGCCGAGCC GGACTCCATG CTGCACTTCT TCCGCCGGGC GCTGCGCCTG 
CGCCGGGACC GCTGTGGCGT CGACGGGGCC ACGCTGACGC AGCTGTCCGC CGAGGACGGG 
GTGGTCACGT TCCGCACCGA CGGCGGACTC ACCTGCGTGC TCAACGCCGG TGAGCGCCCG 
GTCGACCTGC CCCCCGGTGA GGTGCTGCTC GCCAGCGCGC CCCTTCAGGC ACATTCCCCG 
TCGCTTCGCT CGCCCCAGGA TCGGCGGCTA CCCCCCGACA CGGCCGCCTG GGTGGTCTAA

Protein sequence

MGAMAHPPTA DQPWWSRAVF YQVYPRSFHD SDGDGVGDLD GVTAKLDYLS ELGVDALWLN 
PVTVSPMADH GYDVADPRDI DPLFGGIDAL DRLIAAAHDR GIRITMDLVP NHTSSAHPWF 
QAALAAGPGS AQRERYIFRE GTGPDGLLPP NNWISVFGGP AWTRIVEPDG QPGQWYLHLF 
DPEQPDLNWD NPEVFEDLEK TLRFWLDRGV DGFRIDVAHG MAKPPDLPDM EIAENRMLAE 
TASDPRFDHQ GVHDIHRNIR SVLDDYPGAV AVGEVWVYDN AAFAAYLRAD ELHLGFNFRL 
VRADFDADEI HDAIENSLAA VALENATPTW TLSNHDVERE VTRYGGGALG LARARAMALV 
MLALPGVVFV YNGEELGLPN VDLPDEVLQD PVWERSDRTE RGRDGCRVPM PWSGDAPPFG 
FSTTADTWLP MPAEWSSLTV ERQLAEPDSM LHFFRRALRL RRDRCGVDGA TLTQLSAEDG 
VVTFRTDGGL TCVLNAGERP VDLPPGEVLL ASAPLQAHSP SLRSPQDRRL PPDTAAWVV