Gene Mjls_1828 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_1828
Symbol
ID	4877550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	1930212
End bp	1931792
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	67%
IMG OID	640139125
Product	extracellular solute-binding protein
Protein accession	YP_001070107
Protein GI	126434416
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGCC GCCTGAAGAC CGTCGCCGCA CTCGCGGCGG CCGCCGCACT GACCCTGAGC 
GCCTGTGGCG GTTCGGATTC CGGTGGCGGC GCCCCCAGTG CCGCACCCAC CGACAAGGTG 
CTGCACCTGT CGTTCCTGCA GGACCCGGGG CAGCCACCGG ACCCGGACGT CTTCTACGCC 
GGACAGGGTC TACTGCTCAC CACCAACGTG TACGAAGGCC TGATGCAGTA CAAGGGTGGC 
ACCGAGAAGG CGGAGATCGA ACCGCTGCTG GCCACGGAGT GGACCGAATC ACCGGACCAC 
CGCGTGTTCA CCTTCAAGCT GCGGGAGGGG GTGACGTTCC ACGACGGGAC ACCGTTCACC 
GCCGAGGCGG TCAAGGCGTC CTTCGACCGG AGGCTGGCCG TCGACCAGGG CCCCGCGTAC 
ATGGTCGCCG ACGTGGAATC GATCACCACC CAGGGCGACC ATGCCGTCAC GATCACCCTC 
AAGGCACCGA ACGCGGCGTT CCTGGACTAC CTCGCCTGCC CGTACGGTCC GCGCATGCTC 
AGCCCGAAGG GGTTGGCCGA CAACGCCGGT GACGACCACG CCCAGAACTA CCTGACCACC 
CACGATCTCG GCACCGGACC GTACACGCTG ACCGCGGCCG AAGTGGGATC GCGCTACGCA 
CTGGCCGCCT ACCCCGGATA CTGGGGCGAG AAGCCGTATT TCGAGCAGGT GGAGATCCCG 
GTCATCACCG ACGTGTCCGC CCAGCAGCTT CAGTTCAACA ACGGTCAGAT CGCCGCGATC 
CTGCACGATC TGCCGTCGTC GGCGGTCGAG TCGTATCTCA ACAACGACAA GTACGCCCAC 
TTCTCGCTGC CGACGATGAT GTCGAACTAC CTCTACCTCA ACCCGCGCCG CGGCATGCTC 
ACCGACCCGA AGAACCGCGC CGCCGTGCTC GCCGCCATCG ACGTCGACGC GCTGGTCAAA 
CAGACCTACT TCGGACGCGG CAAGAAGGCA GAACAGCTCT ACCCGCCGAA CATGATCGCC 
CCGGAGTTGG CCAAGCAGAA CGTCACCCAC GACCCCTCGC TGCTCACCGA GATCGCGGCC 
GGACTGCCCG CCGACCAGAA GGCCGTCACC ATCGGATACG ACTCCTCCAA CCCCGACAAC 
CAGCTGATCA ACAACCTGAT CCAGACTCAG CTGGCCGCAG CCGGGCTCAA CGCCAAGGTG 
CAGAGCTACC CGACCTCGGA GATCTACGGC TGGATCGGCA ACGACGCCCC CAACGCGCCG 
GACATCCTGA CCGGTACGGC GTGGCCGGAT GCGCCGTCGC CCTACACCTG GGGTCATATC 
TCCTGGGACG CCGACGGCGG GTTGAACTAC CTGGGCTGCT CGGCGCCCCC GGTGACCAGC 
GCACTGGCTC GTGGTCTGGA AACCGGTGAC CCGCAGGTGT TCTCGGAGGC CGCCAAGGCC 
GCCGCCGACA CCGGCTGCTG GCTCAACATC GCCGACGTCG ACGACTTCGT AGTCGCCCAG 
CCGTGGCTCG CAGGGGTCGA GGAGGCGCAC GTGGTGACCA ACCCGAACTC GCTTCGGCTC 
TTCGAACTCT CGGTCGCCTG A

Protein sequence

MIRRLKTVAA LAAAAALTLS ACGGSDSGGG APSAAPTDKV LHLSFLQDPG QPPDPDVFYA 
GQGLLLTTNV YEGLMQYKGG TEKAEIEPLL ATEWTESPDH RVFTFKLREG VTFHDGTPFT 
AEAVKASFDR RLAVDQGPAY MVADVESITT QGDHAVTITL KAPNAAFLDY LACPYGPRML 
SPKGLADNAG DDHAQNYLTT HDLGTGPYTL TAAEVGSRYA LAAYPGYWGE KPYFEQVEIP 
VITDVSAQQL QFNNGQIAAI LHDLPSSAVE SYLNNDKYAH FSLPTMMSNY LYLNPRRGML 
TDPKNRAAVL AAIDVDALVK QTYFGRGKKA EQLYPPNMIA PELAKQNVTH DPSLLTEIAA 
GLPADQKAVT IGYDSSNPDN QLINNLIQTQ LAAAGLNAKV QSYPTSEIYG WIGNDAPNAP 
DILTGTAWPD APSPYTWGHI SWDADGGLNY LGCSAPPVTS ALARGLETGD PQVFSEAAKA 
AADTGCWLNI ADVDDFVVAQ PWLAGVEEAH VVTNPNSLRL FELSVA