Gene Mmcs_1673 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmcs_1673
Symbol
ID	4110508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium sp. MCS
Kingdom	Bacteria
Replicon accession	NC_008146
Strand	+
Start bp	1811359
End bp	1812774
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	58%
IMG OID	638030793
Product	ring hydroxylating dioxygenase, alpha subunit
Protein accession	YP_638839
Protein GI	108798642
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGTTAA AAATGAGTAC TTCAGGCGGT TCGGACACGA CCGCTCGTAG TCTCGTCGAT 
GTCGATCGCG GGGAGATCAG TCGCGAAATC TTCACCGATG CTTCGATTTT CAACCGTGAG 
TTGGAGTATT TGTTTCCGCG GAGCTGGTTG TTTGTGGGTC ATGCCTCGCA GGTCTCTGCG 
CCGGGTCAGT TCTTCTCGTC GAGGATGGGC TCGGATCCGG TGTTGTTGAC CCGTGACGCT 
CAGGGTGGTG TGAATGTCTT GCTCAATTCG TGCCGACATC GGGGTATGGC GGTGTGTCGC 
TACGACGAGG GTCGCGCGCT CCAGTTCACC TGTCCCTATC ATGGCTGGTC GTACTCGATG 
GACGGTTCGC TGGTGTCCAC CCCGGGGGAT TTGCACGGTG TGCCGCAGCA GGGCATGGCC 
TACGGCAACG GCCTTGACAA AGCGGCCTGG GGACTTGTCA GGGCTGCCAA GGTGCACAAT 
TACAAGGGCC TGGTATTCGC GTGCTGGGAT CCATCAGCCC CGGAGTTCGA TGAATACGTT 
GGGGACTTTC ATCATTGGCT GGATAACCTG TCTGATGCTT TTGATGGTAC GGAAGGTGGT 
ACCGAGGTGT TCCGTGGGGT GCAGAAGTGG CGCATCAAAT CAAATTGGAA ATTCGTCTCA 
GAGAATTTCT TGGGCGATAC CTATCACGGG GCGACGACCC ATGCCTCGGT TGAACAGGTG 
GGCATCGGGC CGGGTGGCAG AAATTCACGA CGTCACGGTG AACGACAGGA TCAGGGTGGT 
TTTTCGAAGG GCCGTGTGAA GACGTCGTTT CGGATGGGCC ATGGCGCGTC GGACAATCTG 
GCGTATGAGA TTCCCTATCC TGAGTTCGCC GAAGAACCGG CCTTGAGTGA GTACTTCTCC 
CAGGCGTGGG CGGTCCGCAA GGAGCGACTG CAGGCGCAGG GCAGACAGCT CGGTGGTCGT 
GGCCCAGCGA CGATGTTCCC CAATATGTCG TTCTCCGCCG GTTTTCCGCG GACGATCCTG 
GTGTCACACC CGATCAGCCC CACCGAAACC GAAGTGTGGC GGTGGTACCT CATCGACAAG 
AACGCACCCG ATGATGTACG TGACTGGCTG CGCCGCTATT ACATGCGCTA CTCGGGTCCT 
GGAGGGATGA CGGAGCAAGA CGATATGGAG AACTGGAATT ACGCGACGCA GGCCAGCCAG 
GGCGTGATAG CCCGGCGCTA TCCCTACAAC TATCAGCAGG GTCTCGATAT GGAAACTCCC 
AGTGCGCTCG ACCAGGCTGT GCATTCTCAC CACCCCATCG CAGGCGAGGT GAATGCACGC 
GCCTTTTACC GGCGATGGGC CGAGTTCACC GACAACCTCT CGTGGCCTCA ACTCATCGAA 
CTTGCCAAAT CCGACGAGAG AGCCGCACGG TCGTGA

Protein sequence

MTLKMSTSGG SDTTARSLVD VDRGEISREI FTDASIFNRE LEYLFPRSWL FVGHASQVSA 
PGQFFSSRMG SDPVLLTRDA QGGVNVLLNS CRHRGMAVCR YDEGRALQFT CPYHGWSYSM 
DGSLVSTPGD LHGVPQQGMA YGNGLDKAAW GLVRAAKVHN YKGLVFACWD PSAPEFDEYV 
GDFHHWLDNL SDAFDGTEGG TEVFRGVQKW RIKSNWKFVS ENFLGDTYHG ATTHASVEQV 
GIGPGGRNSR RHGERQDQGG FSKGRVKTSF RMGHGASDNL AYEIPYPEFA EEPALSEYFS 
QAWAVRKERL QAQGRQLGGR GPATMFPNMS FSAGFPRTIL VSHPISPTET EVWRWYLIDK 
NAPDDVRDWL RRYYMRYSGP GGMTEQDDME NWNYATQASQ GVIARRYPYN YQQGLDMETP 
SALDQAVHSH HPIAGEVNAR AFYRRWAEFT DNLSWPQLIE LAKSDERAAR S