Gene Mmcs_4022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_4022
Symbol
ID	4112852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	4285754
End bp	4287490
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	70%
IMG OID	638033165
Product	hypothetical protein
Protein accession	YP_641183
Protein GI	108800986
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0810] Periplasmic protein TonB, links inner and outer membranes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCAGACC CGTCTGTCAG AATCGAAGAC ATGTTCGATG GTTCGTTGCC CGGGATCGGC 
GACTTCTCCG CGCTCAGTGA CGCGGAGTTG GTGGCCGCCT CGGCCGGCTG GGGACGCGCC 
GAAAACGCGG CCACCGCCCG CAAACTGGCC GCCATGGCCG AACTGTTCCG CCGCCGCACC 
GGCTGCGACA CCGCCACCGA CCGCCACAAC TGGTTCGTCG ACCCCGACGC CAACGCCGTC 
AGCGAACTGG CCGCCGCCCA CAACATCACC GAACGCCTGG CCATGTTCCA AACCCACCGC 
GCCGTCGCCC TGGCCGACCG ACTCCCCCAC GTCGCCGCCC TGTTCACCGC CGGACTGATC 
ACCGACCTGC TGGTCCGCGC CATCGTGACC CGCACCGCCC TGATCACCGA CCCCACCCTG 
ATGGCCGCCG TCGACACCGA CCTGGCCGCC CAGATCACCA GCTGGGGACC CCAATCAGAA 
AAGAAAACCC TCGCCGCCAT CGACGCCATC GTCGAAACCC ACGACCCCGG CGCGCTACGG 
CGGGTCAAAG ACGCCGAAAA CGACCGCGGC CTGCAATTCG GCTTCATCAG CGACGCCGCC 
GGCTTCATGA CCGTCTGGGC CCGCATGTAC GCCCCCGACG GCGCCGCCTT CGAACAACGC 
GTCACCGACA TGGCCCACAC CGTCTGCGAC GAGGACCCCC GCACCGCCGA CGAACGCCGC 
AACGACGCCC TGGCCGCCGT CGCCACCGGC ACCCACCTAC GCTGCGAATG CCCCAACCCC 
GACTGCCCCG GCCACCGCGA CACACAACCC ACCAAAGACG TCGTCGTCCA CATCGTCACC 
ACCGAAGAAA CACTCGACGC CGCCCGCACC CAAACCGAAA CGCAGCCCGA ACCGGAGCCC 
GAGCCCGAAG AGGAGGCGCA GCCGGAGCCG GAGGCGCAAG CTGAGACTGA GCCCGAGCCC 
GAGCCCGAAG ACGAGGCGCA GCCGGAGCCG GAGGCGCAAG CTGAGACTGA GCCCGAGCCC 
GAGCCCGAAG ACGAGGCGCA GCCGGAGCCG GAGGCGGAAC CGCAAGCGGA GACTGAGCCA 
GCGCCCGAGC CGGAAGCGGA AGCGGCGGCC ACGCTCACCC CGCAGCAGTC AGCCTGCCGC 
GCACCGGCAT TCGTCATCGG CGCCGGAGTC ACCAACCCCA CCGTGCTCGC CAACTTCCTC 
CACCGCGCCC GCCTCCGCAC CATCCAGCAC CCCGGCAACG CGGCACCCGA ACCCCACTAC 
CGACCCTCGG CAGCCCTGCA GGACTTCGTG CGCTGCCGCG ACCTCACCTG CCGCTTCCCC 
GGCTGCGACG CCCCGGCCAC CCGCTGCGAC ATCGACCACA CCGCGCCCTG GCCGGCCGGA 
CCGACCTGCG CCGCCAACCT CAAATGCCTC TGCCGAAAAC ACCACCTGCT CAAAACCTTC 
TGGACCGGTG AAAACGGTTG GTGCGACCAA CAGTTCACCG ACGCCACCAT CGTGTGGACC 
TCCCCGAGCG GGCAGACCTA CACCACCCGC CCCGGCAGCG CGCTGCTGTT CCCCACCCTG 
TGCACCCCGA CCGCCGACGC GCCGATCCAA CCCACCAAAG ACACCACCAC CGACCGCGGC 
CTCAAAATGC CCAAACGCCG CCGCACCCGC GCCCAAAACC GCGCCCGCCG CATCCAAGAA 
GAACGCCGAC TCAACGACGA CCTCGTCGCC GAACGCAACA AACCACCCCC GTTCTGA

Protein sequence

MSDPSVRIED MFDGSLPGIG DFSALSDAEL VAASAGWGRA ENAATARKLA AMAELFRRRT 
GCDTATDRHN WFVDPDANAV SELAAAHNIT ERLAMFQTHR AVALADRLPH VAALFTAGLI 
TDLLVRAIVT RTALITDPTL MAAVDTDLAA QITSWGPQSE KKTLAAIDAI VETHDPGALR 
RVKDAENDRG LQFGFISDAA GFMTVWARMY APDGAAFEQR VTDMAHTVCD EDPRTADERR 
NDALAAVATG THLRCECPNP DCPGHRDTQP TKDVVVHIVT TEETLDAART QTETQPEPEP 
EPEEEAQPEP EAQAETEPEP EPEDEAQPEP EAQAETEPEP EPEDEAQPEP EAEPQAETEP 
APEPEAEAAA TLTPQQSACR APAFVIGAGV TNPTVLANFL HRARLRTIQH PGNAAPEPHY 
RPSAALQDFV RCRDLTCRFP GCDAPATRCD IDHTAPWPAG PTCAANLKCL CRKHHLLKTF 
WTGENGWCDQ QFTDATIVWT SPSGQTYTTR PGSALLFPTL CTPTADAPIQ PTKDTTTDRG 
LKMPKRRRTR AQNRARRIQE ERRLNDDLVA ERNKPPPF