Gene Mkms_5541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_5541
Symbol
ID	4610307
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008703
Strand	+
Start bp	49008
End bp	50429
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	64%
IMG OID	639789206
Product	hypothetical protein
Protein accession	YP_935541
Protein GI	119854936
COG category	[R] General function prediction only
COG ID	[COG0661] Predicted unusual protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0141158
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACCATC AGGACGTTCC CGTTCCTTTT GGACGGATCC GGCGGACGAT GCCGCTGGCG 
GGTTTCACCG CCCGGGCTGC TGGCGGCCGA GTCATCGCAG GGTTGCGCGA GAAGGCGGGC 
CAGGACGGTG CTGTCGAACA GTTTCACGAG CGCACCGCCG AGCGGTACGC CGAGCTTCTC 
GGCCACTCTC GCGGCGTCCT GATGAAGGTC GGCCAGATCA TGTCACTGCT CGATACTCGC 
GCGGTGGGCA CCGGCGGATT TTGGCCGTAC CAGAAAGCCA TGAGCAGATT GCAGGCAGAC 
GCACCGCCCA TGCATCCCGT ACTGGTCCAT GAGGTTCTCG AAGGCGAACT CGGTTCTGCG 
GTCGAGCATT TCGCGGAGTT CACTGAGGAG CCGATGGCTG CTGCGTCGAT CGGCCAGGTG 
CACCGCGCCG TCCTGCGCGA CGGTCGTCGG GTCGCCGTCA AAATCCAGTA CCCCGGTGTC 
GCTCAAGCCA TCCGCGACGA TCTGGCCAAC GCTGAGCTGC TGGCGACGTT CCTGCGCTTC 
CTCGCCGCCT CGACGTCGGG AGTGAAGCGG GATGTTAAGA GCGTCGCGCG CGAAGTCGCA 
GCGCGAATCT CCGAGGAGGT GGACTATCGG CATGAGGCAG CCACAATCGC AGCATTCAGC 
GAACTCTACC GAGACCACCC GTTCATCCGA GTCCCCGAAG TCATTGCCGA AATGTCTACC 
AATCGGGTGT TGACCATGAC CTATCTCGAC GGGATGGACT GGGCGGCAGC GCAACAGGCC 
GATCAAGATC TCAGAAACGT CTGGGCCGAG ACCATCCTGC GATTCGCGTA CGGAAGCTTC 
CGCCACGCCA ATCTGATGCA CGCCGACCCC CACCCGGGCA ACTACCGCTT CAACACTGAC 
GGCACCGTCG GGTTCGTCGA CTTCGGCTGC GTCAAGGTCC TACCCGAACT CCAGCGCTGG 
CGACAGGTCG CGATGAACCG AGCCCTCCAA GAGGGTCGCA AACAGGATCT TCGAGACATC 
ATGGTGCTGG CCGGCTACCT GACCGCTGAC TCCGACCTGA CCGCAGACGA ACTCTACCAG 
TGGCAGTCCG AACTCCTCGG CGAGTGTATG GCGACCACAC CACAACCCGT GACCTACACA 
GCTGATTCGA TAAATCGTGT CGTCCGCTGC TTGTTCGACG TCCGTGACAC CAACCATCCA 
GTGGCCCGCA TGACCGCCCC CGACGACTAC GTGTTCGCCG CCCGCCTTCA ACTCGCCGTC 
AGCAGTGTCT GCGCCGGCCT CAACGCCACG CTGCCAGTCC GGGCGATCGT CGAGGACTTC 
GATGGAGCGG CCGATCCCGT CACCGAGCTC GGCAAGAAGC ACCATGCCTG GGCCCGCGAG 
CGCGGCCTAC CCTCCGCGTT GGACCATCAT GACCACCCCT GA

Protein sequence

MHHQDVPVPF GRIRRTMPLA GFTARAAGGR VIAGLREKAG QDGAVEQFHE RTAERYAELL 
GHSRGVLMKV GQIMSLLDTR AVGTGGFWPY QKAMSRLQAD APPMHPVLVH EVLEGELGSA 
VEHFAEFTEE PMAAASIGQV HRAVLRDGRR VAVKIQYPGV AQAIRDDLAN AELLATFLRF 
LAASTSGVKR DVKSVAREVA ARISEEVDYR HEAATIAAFS ELYRDHPFIR VPEVIAEMST 
NRVLTMTYLD GMDWAAAQQA DQDLRNVWAE TILRFAYGSF RHANLMHADP HPGNYRFNTD 
GTVGFVDFGC VKVLPELQRW RQVAMNRALQ EGRKQDLRDI MVLAGYLTAD SDLTADELYQ 
WQSELLGECM ATTPQPVTYT ADSINRVVRC LFDVRDTNHP VARMTAPDDY VFAARLQLAV 
SSVCAGLNAT LPVRAIVEDF DGAADPVTEL GKKHHAWARE RGLPSALDHH DHP