Gene Mmcs_0541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_0541
Symbol
ID	4109387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	-
Start bp	600484
End bp	601479
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	68%
IMG OID	638029667
Product	extracellular solute-binding protein
Protein accession	YP_637718
Protein GI	108797521
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.169713
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCTC GCGCGAAGAA CAGACAGCGG GTGATGAAGA GGCTGCTCGC GTTGCTCAGT 
GCCACGGTGC TGGTGCTGGC GGGTTGTGGC CAGGCGGCGT CGGTGGTGCC GACACCCGGG 
GTGACGCTCG CGCCGCCCAC CCCGGCGGGG ATGGAGGAAC TTCCACCCGA ACAGGCGCGG 
CTGCCGATAC CCGAGACCGA CGACTGCAAC CGCCGGGCGA GCCTGCGGCC CTTCCCCACC 
CGCGCCGAGG CCGACGCCGC GGTGGCGTAC ATCCGCGAAC GCGGCAGGCT CATCGTCGGA 
CTGGACATCG GCAGCAATCT GTTCTCCTTC CGCGATCCGA TCACCGGCGA CATCACCGGG 
TTCGACGTCG ACATCGCCGG TGAGATCGCC CGGGACATCT TCGGCAGCCC CGCCCAGGTG 
GACTACCGGA TCCTGTCGTC GGCCGACCGG ATCGTCGCGC TGCAGAACAA TCAGGTGGAC 
GTCGTCGTGA AGTCCATGAC GATCACGTGT GAGCGCAAGA AGAAGGTCGG CTTCTCCACG 
GTGTACCTCA ACGCCGACCA GCGGATCCTG GCGCCACGGG ATTCGGCGAT CACGCGGGCC 
GCGGACCTGT CGGGCCGTCG GGTGTGTGTG GTGAAGGGGA CGACGTCGCT GCGGCGGGTC 
CAGCAGATCA GCCCCCCGCC GATCATCGTG TCCACCGTGA CGTGGGCGGA CTGCCTGGTG 
GCGTTGCAGC AGCGGCAGGT CGACGCGGTC AGCACCGACG ACGCGATCCT GGCGGGGCTC 
GTGGCGCAGG ACCCCTATCT GCACATCGTC GGGCCGAGTA TGAACCAGGA GCCCTACGGG 
ATCGGGGTGA ACCTGGAGAA CACCGGGTTG GTGCGGTTCG TCAACGGGAC GCTGCAGCGC 
ATCCGCAACG ACGGCACCTG GTATGCGCTG TACCGCAAGT GGTTGACGGT GCTGGGTCCC 
GCACCCGCAC CGCCGGTGGC GAGGTACGTG GACTGA

Protein sequence

MSARAKNRQR VMKRLLALLS ATVLVLAGCG QAASVVPTPG VTLAPPTPAG MEELPPEQAR 
LPIPETDDCN RRASLRPFPT RAEADAAVAY IRERGRLIVG LDIGSNLFSF RDPITGDITG 
FDVDIAGEIA RDIFGSPAQV DYRILSSADR IVALQNNQVD VVVKSMTITC ERKKKVGFST 
VYLNADQRIL APRDSAITRA ADLSGRRVCV VKGTTSLRRV QQISPPPIIV STVTWADCLV 
ALQQRQVDAV STDDAILAGL VAQDPYLHIV GPSMNQEPYG IGVNLENTGL VRFVNGTLQR 
IRNDGTWYAL YRKWLTVLGP APAPPVARYV D