Gene Mmcs_1847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1847
Symbol
ID	4110681
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	1990277
End bp	1991857
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	67%
IMG OID	638030967
Product	extracellular solute-binding protein
Protein accession	YP_639012
Protein GI	108798815
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.068039
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCCGCC GCCTGAAGAC CGTCGCCGCA CTCGCGGCGG CCGCCGCACT GACCCTGAGC 
GCCTGTGGCG GTTCGGATTC CGGTGGCGGC GCCCCCAGTG CCGCACCCAC CGACAAGGTG 
CTGCACCTGT CGTTCCTGCA GGACCCGGGG CAGCCACCGG ACCCGGACGT CTTCTACGCC 
GGACAGGGTC TACTGCTCAC CACCAACGTG TACGAAGGCC TGATGCAGTA CAAGGGTGGC 
ACCGAGAAGG CGGAGATCGA ACCGCTGCTG GCCACGGAGT GGACCGAATC ACCGGACCAC 
CGCGTGTTCA CCTTCAAGCT GCGGGAGGGG GTGACGTTCC ACGACGGGAC ACCGTTCACC 
GCCGAGGCGG TCAAGGCGTC CTTCGACCGG AGGCTGGCCG TCGACCAGGG CCCCGCGTAC 
ATGGTCGCCG ACGTGGAATC GATCACCACC CAGGGCGACC ATGCCGTCAC GATCACCCTC 
AAGGCACCGA ACGCGGCGTT CCTGGACTAC CTCGCCTGCC CGTACGGTCC GCGCATGCTC 
AGCCCGAAGG GGTTGGCCGA CAACGCCGGT GACGACCACG CCCAGAACTA CCTGACCACC 
CACGATCTCG GCACCGGACC GTACACGCTG ACCGCGGCCG AAGTGGGATC GCGCTACGCA 
CTGGCCGCCT ACCCCGGATA CTGGGGCGAG AAGCCGTATT TCGAGCAGGT GGAGATCCCG 
GTCATCACCG ACGTGTCCGC CCAGCAGCTT CAGTTCAACA ACGGTCAGAT CGCCGCGATC 
CTGCACGATC TGCCGTCGTC GGCGGTCGAG TCGTATCTCA ACAACGACAA GTACGCCCAC 
TTCTCGCTGC CGACGATGAT GTCGAACTAC CTCTACCTCA ACCCGCGCCG CGGCATGCTC 
ACCGACCCGA AGAACCGCGC CGCCGTGCTC GCCGCCATCG ACGTCGACGC GCTGGTCAAA 
CAGACCTACT TCGGACGCGG CAAGAAGGCA GAACAGCTCT ACCCGCCGAA CATGATCGCC 
CCGGAGTTGG CCAAGCAGAA CGTCACCCAC GACCCCTCGC TGCTCACCGA GATCGCGGCC 
GGACTGCCCG CCGACCAGAA GGCCGTCACC ATCGGATACG ACTCCTCCAA CCCCGACAAC 
CAGCTGATCA ACAACCTGAT CCAGACTCAG CTGGCCGCAG CCGGGCTCAA CGCCAAGGTG 
CAGAGCTACC CGACCTCGGA GATCTACGGC TGGATCGGCA ACGACGCCCC CAACGCGCCG 
GACATCCTGA CCGGTACGGC GTGGCCGGAT GCGCCGTCGC CCTACACCTG GGGTCATATC 
TCCTGGGACG CCGACGGCGG GTTGAACTAC CTGGGCTGCT CGGCGCCCCC GGTGACCAGC 
GCACTGGCTC GTGGTCTGGA AACCGGTGAC CCGCAGGTGT TCTCGGAGGC CGCCAAGGCC 
GCCGCCGACA CCGGCTGCTG GCTCAACATC GCCGACGTCG ACGACTTCGT AGTCGCCCAG 
CCGTGGCTCG CAGGGGTCGA GGAGGCGCAC GTGGTGACCA ACCCGAACTC GCTTCGGCTC 
TTCGAACTCT CGGTCGCCTG A

Protein sequence

MIRRLKTVAA LAAAAALTLS ACGGSDSGGG APSAAPTDKV LHLSFLQDPG QPPDPDVFYA 
GQGLLLTTNV YEGLMQYKGG TEKAEIEPLL ATEWTESPDH RVFTFKLREG VTFHDGTPFT 
AEAVKASFDR RLAVDQGPAY MVADVESITT QGDHAVTITL KAPNAAFLDY LACPYGPRML 
SPKGLADNAG DDHAQNYLTT HDLGTGPYTL TAAEVGSRYA LAAYPGYWGE KPYFEQVEIP 
VITDVSAQQL QFNNGQIAAI LHDLPSSAVE SYLNNDKYAH FSLPTMMSNY LYLNPRRGML 
TDPKNRAAVL AAIDVDALVK QTYFGRGKKA EQLYPPNMIA PELAKQNVTH DPSLLTEIAA 
GLPADQKAVT IGYDSSNPDN QLINNLIQTQ LAAAGLNAKV QSYPTSEIYG WIGNDAPNAP 
DILTGTAWPD APSPYTWGHI SWDADGGLNY LGCSAPPVTS ALARGLETGD PQVFSEAAKA 
AADTGCWLNI ADVDDFVVAQ PWLAGVEEAH VVTNPNSLRL FELSVA