Gene Mkms_1941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_1941
Symbol
ID	4613687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	-
Start bp	2057884
End bp	2059092
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	68%
IMG OID	639791605
Product	hypothetical protein
Protein accession	YP_937930
Protein GI	119867978
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTTCG GCGACGGTCC CGACGACACG GCGCTCGATG CGGCGTGGGC GGCGTTCTGC 
GACCGGTTGA AAGCCGCGGG CGCGCAGGCG TTCAAGGATC ACAACGCCAC CTCGGGCGCA 
CAGCGGGTCG ACGCGTTGCG TTTCCTCACC CAGAACCTGG GTCAGGCCTT CGACCTGGCG 
CTCGAAACCG CCGACACCCG GTATCCGATC GTGCACGCCT TCTGCACCCC GCTGCGCAAA 
CTGGGCGGTG ACAGTGCGGA CTTCACCTAC CACCAGGCCT GGATCGACGG GACACACACC 
TACCGCCTCA CCGGGAACCG GGGCGGCGCA CCGTTTTTCA ACATCACCGT GCAGGGTCCG 
CGGGGTTCGG GTCCCGGCGT CCTGCACGAG CCATTCGGTG ACGTCCCGGA GGTCAACCTG 
TCCGGCTCCC AGCTGGCGAC GGCCGCCGGC GGCGACTTCG AGCTCTACAT CGGTGGACCC 
GAGCGCGGAC CGAACTGGCT GCCGACGACA CCGGGTTCGC GAAAACTGTT CATCCGTCAG 
GGTTTCGACC GGTGGGACGA CCGGCCGGCC GAACTGCGCA TCGAACGCGT CGACATGGCG 
GCCCCGCGGC CACTGCCCAC ACCCGCCGAG ATGGTGGCCG CCATCGATTG GGCCGGTGAC 
TTCGTCGAAG GGGTGATGCG CGACTGGCCG GACTACCCGT TCACCTACGG CGGCGTCGAC 
GCCGCGCACC CCAACCGGTT TCCCGCCGTC GACTCCGACA CCGGTGACGA CAAGAGGGGC 
CGCGCGGCGG CGAACATGTT CTGGGAACTC GGCGCCGACG AAGCGCTGAT CATCGAGTTC 
GACGCGCACG AGGGCCTGTG GATGCTCACC AACATGGGCG TGTTCTTCAA CAGCATGGAC 
TACCTGTACC GGCCCGTCTC CTACACCCCG AGCCGCACGG TGACCGACGG TGACGGGCGG 
ATCCGCATCG TGCTGGCCCA CGACGATCCG GGCTGTCACA ACTGGCTCGA CACCCAGGGA 
TTCAGCCGCG GCAACGTCAC CTACCGGCAC ATGCTGGCCG GAAAGCCCGC CGTGCTGCAC 
ACCAGGCTGG TGGCCCGGTC CGACCTCGCC GACGCGCTAC CGTCGGACAC CGCCACCGTC 
ACCGGCGAGC AACGCGTCGC CCAGATGTGG GCCCGGTTCA ACGGGATCCG ACGACGCCAC 
CGGATGTGA

Protein sequence

MAFGDGPDDT ALDAAWAAFC DRLKAAGAQA FKDHNATSGA QRVDALRFLT QNLGQAFDLA 
LETADTRYPI VHAFCTPLRK LGGDSADFTY HQAWIDGTHT YRLTGNRGGA PFFNITVQGP 
RGSGPGVLHE PFGDVPEVNL SGSQLATAAG GDFELYIGGP ERGPNWLPTT PGSRKLFIRQ 
GFDRWDDRPA ELRIERVDMA APRPLPTPAE MVAAIDWAGD FVEGVMRDWP DYPFTYGGVD 
AAHPNRFPAV DSDTGDDKRG RAAANMFWEL GADEALIIEF DAHEGLWMLT NMGVFFNSMD 
YLYRPVSYTP SRTVTDGDGR IRIVLAHDDP GCHNWLDTQG FSRGNVTYRH MLAGKPAVLH 
TRLVARSDLA DALPSDTATV TGEQRVAQMW ARFNGIRRRH RM