Gene Mvan_4415 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mvan_4415
Symbol
ID	4649006
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Mycobacterium vanbaalenii PYR-1
Kingdom	Bacteria
Replicon accession	NC_008726
Strand	+
Start bp	4738281
End bp	4739621
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	62%
IMG OID	639807886
Product	ring hydroxylating dioxygenase, alpha subunit
Protein accession	YP_955197
Protein GI	120405368
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.415837
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGACT TCACCGACCT CGTCGACCCT GAGCACGGCT GGGTCAGCCC ACAGATCTAT 
ACCGACCCCG AGATCTACGA ACGCGAGTTG CAACACGTGT TCGGACGCAG CTGGCTGTTT 
CTGGCGCACG ACTCCCAGCT GCCCAAGCCG GGCAGCTTCC TGCAGACCTA CATGGGCGAG 
GATCCGGTGC TCGTCGTCCG CCAGCGCGAT GGGTCGGTCC GCGCCTTTCT GAACCAGTGC 
CGGCATCGAG GCATGCGGAT CTGTCGCTCC GAAGCCGGTG TCAGCAAGGC CTTCACCTGT 
ACCTACCACG GTTGGTCCTA TGACCTGGCG GGCAACCTCA TCAACGTGCC GCTGGAAGAG 
CGTGCCTACC ACAGCTCCAT CGACAAGAAG GAGTGGGGCG CAATGAAAGT GCCTCGCGTA 
GCCAACTATC GCGGGTTCTA CTTCGGCACC TGGTCGGAGG AAACTCCGGA GTTCGACGCC 
TACCTCGGTG ATATGGCCTT CTACTTCGAC GCGATCGTCG ACCGTTTCGA CTCAGGTCTG 
GAGTTCGTCA AGGGCACCAC GAAATGGGTG ATCGACTGCA ATTGGAAGTT CGCGTCCGAA 
CAGTTCGCCA GCGACATGTA CCACACCCAG TCGGCGCACG CCTCAGCCCT GCTGGCACTC 
ACCGATGATC CCAACCCAAT AGGGCCGCTC AACGACCCCA ACGTGCCCGG GCGTCAGTTC 
AGCGGGAACG GGCACGGGTC CGGCGGCTAC TTCCTGCCCG CTCCCGTGGT GAAGACGCCG 
GAAATGACCG ACACCATGTT CGAATGGTTC AAGAGTCGTG AGGAGGAGAT GGTCGCACGG 
ATCGGGGCCG ACCGGCTGAG CAAGGTGAGC ATCACGCACA ACACCATCTT CCCGAACTTC 
TCCTGGCTCG GAGCGCACTC CACCATGCGG GTCTGGCATC CACGCGGGCC CGGGCAGATC 
GAAGTCTGGG CGTGGACTTA CGTTCCCAAA GACGCCCCGC CCAAGGTGAA GAACGAGATC 
CGCGAGCTCA CCCAACGAAC TTTCAGCCCC GCCGGCTCCT TCGAAACCGA CGACGGTGAG 
AACTGGACGG AGATCCAGCA AGTGCTCCGA GGTTCCCAGG CCCGCCGCAA CCGGTTACAT 
ACCGCCATGG GTGTCGGCTA CGAAGAGCGC GACGCCTTTG GACTGCCCGG ACTCGGCAAT 
GACGTGTACT CCGAGACGGC AGCGCGGGGC TTCTACCGCC ACTGGCTCGA CATGCTGACC 
GGAAAGCCGT GGTCGGAGAT TCAGAAATGG ACGCCTAACG GCAATCACGG CGAACTGCGC 
GACGAAGGGG TGACCGCATG A

Protein sequence

MIDFTDLVDP EHGWVSPQIY TDPEIYEREL QHVFGRSWLF LAHDSQLPKP GSFLQTYMGE 
DPVLVVRQRD GSVRAFLNQC RHRGMRICRS EAGVSKAFTC TYHGWSYDLA GNLINVPLEE 
RAYHSSIDKK EWGAMKVPRV ANYRGFYFGT WSEETPEFDA YLGDMAFYFD AIVDRFDSGL 
EFVKGTTKWV IDCNWKFASE QFASDMYHTQ SAHASALLAL TDDPNPIGPL NDPNVPGRQF 
SGNGHGSGGY FLPAPVVKTP EMTDTMFEWF KSREEEMVAR IGADRLSKVS ITHNTIFPNF 
SWLGAHSTMR VWHPRGPGQI EVWAWTYVPK DAPPKVKNEI RELTQRTFSP AGSFETDDGE 
NWTEIQQVLR GSQARRNRLH TAMGVGYEER DAFGLPGLGN DVYSETAARG FYRHWLDMLT 
GKPWSEIQKW TPNGNHGELR DEGVTA