Gene Mvan_0533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_0533
Symbol
ID	4644858
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	574710
End bp	576125
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	59%
IMG OID	639804038
Product	ring hydroxylating dioxygenase, alpha subunit
Protein accession	YP_951383
Protein GI	120401554
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.379734
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTTAA AAATGAGTAC TTCAGGCGGT TCGGACACGA CCGCTCGTAG TCTCGTCGAT 
GTCGATCGCG GGGAGATCAG TCGCGAAATC TTCACCGATG CTTCGATTTT CAACCGTGAG 
TTGGAGTATT TGTTTCCGCG GAGCTGGTTG TTTGTGGGTC ATGCCTCGCA GGTCTCTGCG 
CCGGGTCAGT TCTTCTCGTC GAGGATGGGC TCGGATCCGG TGTTGTTGAC CCGTGACGCT 
CAGGGTGGTG TGAATGTCTT GCTCAATTCG TGCCGACATC GGGGTATGGC GGTGTGTCGC 
TACGACGAGG GTCGCGCGCT CCAGTTCACC TGTCCCTACC ATGGCTGGTC GTACTCGATG 
GACGGTTCGC TGGTGTCCAC CCCGGGGGAT TTGCACGGTG TGCCGCAGCA GGGCATGGCC 
TACGGCAACG GCCTTGACAA AGCGGCCTGG GGACTTGTCA GGGCTGCCAA GGTGCACAAC 
TTCAAAGGCC TGATCTTCGC GTGCTGGGAC CCCGCCGCCC CGGATTTCGA CGAGTATGTC 
GGCGACTTTC ACTATTGGCT GGACAACCTG GCTGATGCTT TCGATGGCAC CGAGGGCGCG 
ACCGAGGTGT TCCGTGGAGT GCAGAAGTGG CGCATCAAGT CGAATTGGAA ATTCGTCTCA 
GAGAATTTCT TGGGCGATAC CTATCACGGG GCGACGACTC ACGCCTCAGT TGAACAGGTG 
GGTATCGGCC CGGGCGGCAG AAACTCCCGG CGTCACGGTG AACGACAGGA TCAGGGTGGT 
TTTTCGAAGG GCCGAGTGAA GACGTCGTTT CGTACGGGCC ACGGTGCATC GGACAACCTG 
GCGTATGAGA TCGCCTATCC TGAGTTCGCC GAAGAACCGG CCTTGAGTGA GTACTTCTCC 
CAGGCCTGGG CACTCCGTAA AGAGCGGTTA GAGGCGCAGG GCAGACAGCT CGGTGGTCGT 
GGCCCAGCGA CGATGTTCCC CAATATGTCG TTCTCCGCCG GTTTTCCGCG GACGATCCTG 
GTGTCACACC CGATCAGCCC CACCGAAACC GAAGTGTGGC GGTGGTACCT CATCGACAAG 
AACGCACCCG ATGATGTACG TGACTGGCTG CGCCGCTATT ACATGCGCTA CTCGGGTCCT 
GGAGGGATGA CGGAGCAAGA CGATATGGAG AACTGGAATT ACGCGACGCA GGCCAGCCAG 
GGCGTGATAG CCCGGCGCTA TCCCTACAAC TATCAGCAGG GTCTCGATAT GGAAACTCCC 
AGTGCGCTCG ACCAGGCTGT GCATTCTCAC CACCCCATCG CAGGCGAGGT GAATGCACGC 
GCCTTTTACC GGCGATGGGC CGAGTTCACC GACAACCTCT CGTGGCCTCA ACTCATCGAA 
CTTGCCAAAT CCGACGAGAG AGCCGCACGG TCGTGA

Protein sequence

MTLKMSTSGG SDTTARSLVD VDRGEISREI FTDASIFNRE LEYLFPRSWL FVGHASQVSA 
PGQFFSSRMG SDPVLLTRDA QGGVNVLLNS CRHRGMAVCR YDEGRALQFT CPYHGWSYSM 
DGSLVSTPGD LHGVPQQGMA YGNGLDKAAW GLVRAAKVHN FKGLIFACWD PAAPDFDEYV 
GDFHYWLDNL ADAFDGTEGA TEVFRGVQKW RIKSNWKFVS ENFLGDTYHG ATTHASVEQV 
GIGPGGRNSR RHGERQDQGG FSKGRVKTSF RTGHGASDNL AYEIAYPEFA EEPALSEYFS 
QAWALRKERL EAQGRQLGGR GPATMFPNMS FSAGFPRTIL VSHPISPTET EVWRWYLIDK 
NAPDDVRDWL RRYYMRYSGP GGMTEQDDME NWNYATQASQ GVIARRYPYN YQQGLDMETP 
SALDQAVHSH HPIAGEVNAR AFYRRWAEFT DNLSWPQLIE LAKSDERAAR S