Gene Mkms_4097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mkms_4097
Symbol
ID	4612037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. KMS
Kingdom	Bacteria
Replicon accession	NC_008705
Strand	+
Start bp	4321697
End bp	4323433
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	70%
IMG OID	639793781
Product	hypothetical protein
Protein accession	YP_940079
Protein GI	119870127
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0810] Periplasmic protein TonB, links inner and outer membranes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.481016
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCAGACC CGTCTGTCAG AATCGAAGAC ATGTTCGATG GTTCGTTGCC CGGGATCGGC 
GACTTCTCCG CGCTCAGTGA CGCGGAGTTG GTGGCCGCCT CGGCCGGCTG GGGACGCGCC 
GAAAACGCGG CCACCGCCCG CAAACTGGCC GCCATGGCCG AACTGTTCCG CCGCCGCACC 
GGCTGCGACA CCGCCACCGA CCGCCACAAC TGGTTCGTCG ACCCCGACGC CAACGCCGTC 
AGCGAACTGG CCGCCGCCCA CAACATCACC GAACGCCTGG CCATGTTCCA AACCCACCGC 
GCCGTCGCCC TGGCCGACCG ACTCCCCCAC GTCGCCGCCC TGTTCACCGC CGGACTGATC 
ACCGACCTGC TGGTCCGCGC CATCGTGACC CGCACCGCCC TGATCACCGA CCCCACCCTG 
ATGGCCGCCG TCGACACCGA CCTGGCCGCC CAGATCACCA GCTGGGGACC CCAATCAGAA 
AAGAAAACCC TCGCCGCCAT CGACGCCATC GTCGAAACCC ACGACCCCGG CGCGCTACGG 
CGGGTCAAAG ACGCCGAAAA CGACCGCGGC CTGCAATTCG GCTTCATCAG CGACGCCGCC 
GGCTTCATGA CCGTCTGGGC CCGCATGTAC GCCCCCGACG GCGCCGCCTT CGAACAACGC 
GTCACCGACA TGGCCCACAC CGTCTGCGAC GAGGACCCCC GCACCGCCGA CGAACGCCGC 
AACGACGCCC TGGCCGCCGT CGCCACCGGC ACCCACCTAC GCTGCGAATG CCCCAACCCC 
GACTGCCCCG GCCACCGCGA CACACAACCC ACCAAAGACG TCGTCGTCCA CATCGTCACC 
ACCGAAGAAA CACTCGACGC CGCCCGCACC CAAACCGAAA CGCAGCCCGA ACCGGAGCCC 
GAGCCCGAAG AGGAGGCGCA GCCGGAGCCG GAGGCGCAAG CTGAGACTGA GCCCGAGCCC 
GAGCCCGAAG ACGAGGCGCA GCCGGAGCCG GAGGCGCAAG CTGAGACTGA GCCCGAGCCC 
GAGCCCGAAG ACGAGGCGCA GCCGGAGCCG GAGGCGGAAC CGCAAGCGGA GACTGAGCCA 
GCGCCCGAGC CGGAAGCGGA AGCGGCGGCC ACGCTCACCC CGCAGCAGTC AGCCTGCCGC 
GCACCGGCAT TCGTCATCGG CGCCGGAGTC ACCAACCCCA CCGTGCTCGC CAACTTCCTC 
CACCGCGCCC GCCTCCGCAC CATCCAGCAC CCCGGCAACG CGGCACCCGA ACCCCACTAC 
CGACCCTCGG CAGCCCTGCA GGACTTCGTG CGCTGCCGCG ACCTCACCTG CCGCTTCCCC 
GGCTGCGACG CCCCGGCCAC CCGCTGCGAC ATCGACCACA CCGCGCCCTG GCCGGCCGGA 
CCGACCTGCG CCGCCAACCT CAAATGCCTC TGCCGAAAAC ACCACCTGCT CAAAACCTTC 
TGGACCGGTG AAAACGGTTG GTGCGACCAA CAGTTCACCG ACGCCACCAT CGTGTGGACC 
TCCCCGAGCG GGCAGACCTA CACCACCCGC CCCGGCAGCG CGCTGCTGTT CCCCACCCTG 
TGCACCCCGA CCGCCGACGC GCCGATCCAA CCCACCAAAG ACACCACCAC CGACCGCGGC 
CTCAAAATGC CCAAACGCCG CCGCACCCGC GCCCAAAACC GCGCCCGCCG CATCCAAGAA 
GAACGCCGAC TCAACGACGA CCTCGTCGCC GAACGCAACA AACCACCCCC GTTCTGA

Protein sequence

MSDPSVRIED MFDGSLPGIG DFSALSDAEL VAASAGWGRA ENAATARKLA AMAELFRRRT 
GCDTATDRHN WFVDPDANAV SELAAAHNIT ERLAMFQTHR AVALADRLPH VAALFTAGLI 
TDLLVRAIVT RTALITDPTL MAAVDTDLAA QITSWGPQSE KKTLAAIDAI VETHDPGALR 
RVKDAENDRG LQFGFISDAA GFMTVWARMY APDGAAFEQR VTDMAHTVCD EDPRTADERR 
NDALAAVATG THLRCECPNP DCPGHRDTQP TKDVVVHIVT TEETLDAART QTETQPEPEP 
EPEEEAQPEP EAQAETEPEP EPEDEAQPEP EAQAETEPEP EPEDEAQPEP EAEPQAETEP 
APEPEAEAAA TLTPQQSACR APAFVIGAGV TNPTVLANFL HRARLRTIQH PGNAAPEPHY 
RPSAALQDFV RCRDLTCRFP GCDAPATRCD IDHTAPWPAG PTCAANLKCL CRKHHLLKTF 
WTGENGWCDQ QFTDATIVWT SPSGQTYTTR PGSALLFPTL CTPTADAPIQ PTKDTTTDRG 
LKMPKRRRTR AQNRARRIQE ERRLNDDLVA ERNKPPPF