Gene Mmcs_4640 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_4640
Symbol
ID	4113469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	4913229
End bp	4914386
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	65%
IMG OID	638033791
Product	Rieske (2Fe-2S) region
Protein accession	YP_641800
Protein GI	108801603
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGTACCG ACACCGCCCA CAGCGGCATT CGCGAGATCG ACACCGGAAC CCTGCCCGAC 
CGGTACGCCA GGGGCTGGCA CTGCCTCGGC CCGGTCAACG ACTACCTCGA CGGCGAACCG 
CACTCCGTCG AGGCGTTCGG CACCAAACTC GTGGTGTTCG CCGATTCGAA GGGCGACGTC 
AAGATCCTCG ACGGCTACTG CCGGCACATG GGCGGCGACC TGTCCCAGGG CACCATCAAG 
GGTGACGAGG TCGCCTGCCC CTTCCACGAC TGGCGCTGGG GCGGCGACGG CAAGTGCAAG 
CTCGTGCCCT ACGCCAAGCG GACGCCGCGG CTGGCCCGCA CCCGCGCCTG GACCACCGAC 
GTGCGCAGCG GTCTGCTGTT CGTCTGGCAC GACCACGAGG GCAACCCGCC TCCCCCCGAG 
GTGCGCATCC CCGAGATCCC GGAGTTCGCC AGCGACGAGT GGACCGACTG GCGGTGGAAC 
TCGATCCTGA TCGAGGGCGC GAACTGCCGC GAGATCATCG ACAACGTCAC CGACATGGCG 
CACTTCTTCT ACATCCACTT CGGGCTGCCC ACGTACTTCA AGAACGTGTT CGAGGGCCAC 
ATCGCCAGCC AGTACCTGCA CAATGTGGGC CGCCCCGACG TCAACGACAT GGGCACCACC 
TACGGCGAAG CGCACCTCGA CTCCGAGGCG TCGTATTTCG GGCCGTCGTT CATGATCAAT 
TGGCTGCACA ACAACTACGG CGGCTACAAG GCCGAGTCCA TCCTGATCAA CTGCCACTAC 
CCGGTGACCC AGGATTCGTT CGTGCTGCAG TGGGGCGTCA TCGTCGAGAA GCCCAAGGGC 
ATGGACGAGA AGATGACCGA CAAGCTGGCG CGGACCTTCA CCGACGGCGT CAGCAAGGGC 
TTCCTGCAGG ACGTCGAGAT CTGGAAGCAC AAGACGCGTA TCGACAATCC GCTGCTGGTC 
GAAGAGGACG GCGCGGTCTA CCAGCTGCGC CGCTGGTATC AGCAGTTCTA CGTCGACGTC 
GCCGACGTGA CCCCGGAGAT GACCGACCGT TTCGAGATCG AGGTCGACAC CACCGCGGCC 
AACGAGTACT GGAACACCGA GGTTCAGGAG AATCTCGCGC GCCGCGAGGG CGAGAAAGCC 
GAACAGCCGA CCCCATGA

Protein sequence

MSTDTAHSGI REIDTGTLPD RYARGWHCLG PVNDYLDGEP HSVEAFGTKL VVFADSKGDV 
KILDGYCRHM GGDLSQGTIK GDEVACPFHD WRWGGDGKCK LVPYAKRTPR LARTRAWTTD 
VRSGLLFVWH DHEGNPPPPE VRIPEIPEFA SDEWTDWRWN SILIEGANCR EIIDNVTDMA 
HFFYIHFGLP TYFKNVFEGH IASQYLHNVG RPDVNDMGTT YGEAHLDSEA SYFGPSFMIN 
WLHNNYGGYK AESILINCHY PVTQDSFVLQ WGVIVEKPKG MDEKMTDKLA RTFTDGVSKG 
FLQDVEIWKH KTRIDNPLLV EEDGAVYQLR RWYQQFYVDV ADVTPEMTDR FEIEVDTTAA 
NEYWNTEVQE NLARREGEKA EQPTP