Gene Mmcs_5450 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_5450
Symbol
ID	4114535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008147
Strand	-
Start bp	30227
End bp	31642
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	58%
IMG OID	638034605
Product	ring hydroxylating dioxygenase, alpha subunit
Protein accession	YP_642606
Protein GI	108802410
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTTAA AAATGAGTAC TTCAGGCGGT TCGGACACGA CCGCTCGTAG TCTCGTCGAT 
GTCGATCGCG GGGAGATCAG TCGCGAAATC TTCACCGATG CTTCGATTTT CAACCGTGAG 
TTGGAGTATT TGTTTCCGCG GAGCTGGTTG TTTGTGGGTC ATGCCTCGCA GGTGTCTGCG 
CCGGGTCAGT TCTTCTCGTC GAGGATGGGC TCGGATCCGG TGTTGTTGAC CCGTGACGCT 
CAGGGTGGTG TGAATGTCTT GCTCAATTCG TGCCGACATC GGGGTATGGC GGTGTGTCGC 
TATGACGAGG GCCGTACGCT GCAGTTCACC TGTCCCTATC ATGGCTGGTC GTACTCGATG 
GACGGTTCGC TGGTGTCCAC TCCAGGGGAT TTGCACGGTG TGCCGCAGCA GGGCATGGCC 
TACGGCAACG GCCTTGACAA AGCGGCCTGG GGACTTGTCA GGGCTGCCAA GGTGCACAAT 
TACAAGGGCC TGGTATTCGC GTGCTGGGAT CCATCAGCCC CGGAGTTCGA TGAATACGTT 
GGGGACTTTC ATCATTGGCT GGATAACCTG TCTGATGCTT TTGATGGTAC GGAAGGTGGT 
ACCGAGGTGT TCCGTGGGGT GCAGAAGTGG CGCATCAAAT CAAATTGGAA ATTCGTCTCA 
GAGAATTTCT TGGGCGATAC CTATCACGGG GCGACGACCC ATGCCTCGGT TGAACAGGTG 
GGCATCGGGC CGGGTGGCAG AAATTCACGA CGTCACGGTG AACGACAGGA TCAGGGTGGT 
TTTTCGAAGG GCCGTGTGAA GACGTCGTTT CGGATGGGCC ATGGCGCGTC GGACAATCTG 
GCGTATGAGA TTCCCTATCC TGAGTTCGCC GAAGAACCGG CCTTGAGTGA GTACTTCTCC 
CAGGCGTGGG CGGTCCGCAA GGAGCGACTG CAGGCGCAGG GCAGACTGCT CGGTGGTCGT 
GGCCCGGCGA CGATGTTCCC CAATATGTCG TTTTCGGCCG GTTTTCCGCG GACGATCCTG 
GTGTCACATC CGATCAGCCC GACCGAAACC GAGGTGTGGC GCTGGTATCT CGTCGACAAG 
AACGCACCCG ATGATGTGCG TGACTGGTTG CGCCGCTATT ACATGCGCTA CTCGGGTCCT 
GGAGGGATGA CGGAGCAAGA CGATATGGAG AACTGGAATT ACGCGACGCA GGCCAGCCAG 
GGCGTGATAG CCCGGCGCTA CCCCTACAAC TATCAGCAGG GTCTCGGCAA GGAAACTCCC 
AGTGAGCTCG ACCAGGCGGT GCATTCTCAC CAGCCCATCG CTGGCGAGGT GAATGCACGC 
GCCTTTTACC GGCGATGGGC CGAGTTCACC GACAACCTCT CGTGGCCCCT ACTCATCGAA 
CTCGCCAAAT CCGACGAGAG AGCCGCACGG TCGTGA

Protein sequence

MTLKMSTSGG SDTTARSLVD VDRGEISREI FTDASIFNRE LEYLFPRSWL FVGHASQVSA 
PGQFFSSRMG SDPVLLTRDA QGGVNVLLNS CRHRGMAVCR YDEGRTLQFT CPYHGWSYSM 
DGSLVSTPGD LHGVPQQGMA YGNGLDKAAW GLVRAAKVHN YKGLVFACWD PSAPEFDEYV 
GDFHHWLDNL SDAFDGTEGG TEVFRGVQKW RIKSNWKFVS ENFLGDTYHG ATTHASVEQV 
GIGPGGRNSR RHGERQDQGG FSKGRVKTSF RMGHGASDNL AYEIPYPEFA EEPALSEYFS 
QAWAVRKERL QAQGRLLGGR GPATMFPNMS FSAGFPRTIL VSHPISPTET EVWRWYLVDK 
NAPDDVRDWL RRYYMRYSGP GGMTEQDDME NWNYATQASQ GVIARRYPYN YQQGLGKETP 
SELDQAVHSH QPIAGEVNAR AFYRRWAEFT DNLSWPLLIE LAKSDERAAR S