Gene Mjls_5022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mjls_5022
Symbol
ID	4880720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. JLS
Kingdom	Bacteria
Replicon accession	NC_009077
Strand	+
Start bp	5261140
End bp	5262297
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	65%
IMG OID	640142332
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001073277
Protein GI	126437586
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTACCG ACACCGCCCA CAGCGGCATT CGCGAGATCG ACACCGGAAC CCTGCCCGAC 
CGGTACGCCA GGGGCTGGCA CTGCCTCGGC CCGGTCAACG ACTACCTCGA CGGCGAACCG 
CACTCCGTCG AGGCGTTCGG CACCAAACTC GTGGTGTTCG CCGATTCGAA GGGCGACGTC 
AAAATCCTCG ACGGCTACTG CCGGCACATG GGCGGTGACC TGTCCCAGGG CACCATCAAG 
GGTGACGAGG TCGCCTGCCC CTTCCACGAC TGGCGCTGGG GCGGCGACGG CAAGTGCAAG 
CTCGTGCCCT ACGCCAAGCG GACGCCGCGG CTGGCCCGCA CCCGCGCCTG GACCACCGAC 
GTGCGCAGCG GTCTGCTGTT CGTCTGGCAC GACCACGAGG GCAACCCGCC TCCCCCCGAG 
GTGCGCATCC CCGAGATCCC GGAGTTCGCC AGCGACGAGT GGACCGACTG GCGGTGGAAC 
TCGATCCTGA TCGAGGGCGC GAACTGCCGC GAGATCATCG ACAACGTCAC CGACATGGCG 
CACTTCTTCT ACATCCACTT CGGGCTGCCC ACGTACTTCA AGAACGTGTT CGAGGGCCAC 
ATCGCCAGCC AGTACCTGCA CAATGTGGGC CGCCCCGACG TCAACGACAT GGGCACCACC 
TACGGCGAAG CGCACCTCGA CTCCGAGGCG TCGTATTTCG GGCCGTCGTT CATGATCAAC 
TGGCTGCACA ACAACTACGG CGGCTACAAG GCCGAGTCCA TCCTGATCAA CTGCCACTAC 
CCGGTGACCC AGGATTCGTT CGTGCTGCAG TGGGGCGTCA TCGTCGAGAA GCCCAAGGGC 
ATGGACGAGA AGATGACCGA CAAGCTGGCG CGGACGTTCA CCGACGGCGT CAGCAAGGGC 
TTCCTGCAGG ACGTCGAGAT CTGGAAGCAC AAGACGCGTA TCGACAATCC GCTGCTGGTC 
GAAGAGGACG GCGCGGTCTA CCAGCTGCGC CGCTGGTATC AGCAGTTCTA CGTCGACGTC 
GCCGACGTGA CCCCGGAGAT GACGGACCGT TTCGAGATCG AGGTCGACAC CACCGCGGCC 
AACGAGTACT GGAACACCGA GGTTCAGGAG AATCTCGCGC GCCGCGAGGG CGAGAAAGCC 
GAACAGCCGA CCCCATGA

Protein sequence

MSTDTAHSGI REIDTGTLPD RYARGWHCLG PVNDYLDGEP HSVEAFGTKL VVFADSKGDV 
KILDGYCRHM GGDLSQGTIK GDEVACPFHD WRWGGDGKCK LVPYAKRTPR LARTRAWTTD 
VRSGLLFVWH DHEGNPPPPE VRIPEIPEFA SDEWTDWRWN SILIEGANCR EIIDNVTDMA 
HFFYIHFGLP TYFKNVFEGH IASQYLHNVG RPDVNDMGTT YGEAHLDSEA SYFGPSFMIN 
WLHNNYGGYK AESILINCHY PVTQDSFVLQ WGVIVEKPKG MDEKMTDKLA RTFTDGVSKG 
FLQDVEIWKH KTRIDNPLLV EEDGAVYQLR RWYQQFYVDV ADVTPEMTDR FEIEVDTTAA 
NEYWNTEVQE NLARREGEKA EQPTP