Gene Mkms_5475 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_5475
Symbol
ID	4613159
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	5712215
End bp	5713555
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	70%
IMG OID	639795169
Product	hypothetical protein
Protein accession	YP_941450
Protein GI	119871498
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3408] Glycogen debranching enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.509766
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.162072
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACACG ACCCCAGCTT CGCGCCCACG CAACTCGCGG CCCGCGCCGC GTACCTCCTG 
CGCGGTAACG ACCTGGGCGC GATGACCACC GCGGCGCCCC TGCTGTACCC GCACATGTGG 
AGCTGGGATG CCGCGTTCGT GGCGATCGGG CTGGCGCCGT TGAGCGTCGA GCGTGCGGTC 
GTCGAACTCG ACACGTTGCT CTCCGCACAG TGGCGCAACG GGATGATCCC GCACATCGTG 
TTCGCCAACG GGGTCGACGG ATACTTCCCG GGCCCCGCCC GCTGGGCGAC GTCCGCCCTG 
GCGGCCGACT CCCCGCGCAC CCGCCACACC TCCGGGATCA CCCAGCCGCC CGTGCACGCG 
ATCGCCGTAC AGCGCATCCT CGACCACGCC CGCACCAGGG GCCGGTCGAC CCGCCAGGTG 
GCCGAGGCCT TCCTCGACCG GCGCTGGGGG GATCTGGTGC GCTGGCACCG CTGGCTGGCC 
GAATGCCGCG ACCAGAACGG CCGCGGCCGC ATCACGCTCT ATCACGGGTG GGAGTCCGGC 
ATGGACAACT CCCCGCGGTG GGATGCCGCC TACGCCAACG TGATTCCGGG TGCGGTGCCG 
GAATATCAGC GCGAGGACAA CAAGATCAAC ACCGACGCCA CCCAGCGGCC GTCCGATCAC 
GAGTACGACC GCTACCTGTG GTTGCTCGAG GAGATGAAAT CCGCCCGCTA CGACGATCAT 
CTGCTGCCGA AGGTGATGAG TTTCGCCGTC GAGGACGTGT TCGTCTCGGC GATCTTCTCG 
GTGGCCTGTC AGGTGCTCGC CGAGATCGGG GAGGACTACA AACGCCCCAA CGCCGACGTG 
CGTGACCTGT ACGCGTGGGC CGAGCGGTTC CGCGCCGGCG TCATCGAGAC CACCGACCAA 
CGCACCGGCG CGGCAAGGGA TTTCGACGTC CGCACGGAGA AGTGGGTGGC CACCGAGACC 
GTCGCGCAGT TCGCCCCGCT GTTGTGCGGC GGCCTGCCGC ACCACCGGGA GCGGGCGCTG 
CTGCGCCTGC TGGAGGGGCC GCGGTTCTGC GGGCATCCCG ACCTCAGATA CGCGTGCATC 
CCCTCGACGT CGCCGGTGTC ACGCGACTTC CGGCCGCGGG AGTACTGGCG CGGCCCGGTC 
TGGCCGGTGA TGACGTGGCT GTTCGCCTGG TGCTTCGCCC GGCGCGGGTG GGCCGAACGG 
GCCAGGGTGC TACGGCACGA GGGACTGCGC CAGGCCAGCG ACGGCACCTT CGCCGAGTAC 
TACGAACCGT TCACCGGCGA ACCGTTGGGC AGCATGCAGC AGTCGTGGAC CGCCGCGGCG 
GTACTGGACT GGCTGGGCTA G

Protein sequence

MPHDPSFAPT QLAARAAYLL RGNDLGAMTT AAPLLYPHMW SWDAAFVAIG LAPLSVERAV 
VELDTLLSAQ WRNGMIPHIV FANGVDGYFP GPARWATSAL AADSPRTRHT SGITQPPVHA 
IAVQRILDHA RTRGRSTRQV AEAFLDRRWG DLVRWHRWLA ECRDQNGRGR ITLYHGWESG 
MDNSPRWDAA YANVIPGAVP EYQREDNKIN TDATQRPSDH EYDRYLWLLE EMKSARYDDH 
LLPKVMSFAV EDVFVSAIFS VACQVLAEIG EDYKRPNADV RDLYAWAERF RAGVIETTDQ 
RTGAARDFDV RTEKWVATET VAQFAPLLCG GLPHHRERAL LRLLEGPRFC GHPDLRYACI 
PSTSPVSRDF RPREYWRGPV WPVMTWLFAW CFARRGWAER ARVLRHEGLR QASDGTFAEY 
YEPFTGEPLG SMQQSWTAAA VLDWLG