Gene Bphy_3201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bphy_3201
Symbol
ID	6244884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia phymatum STM815
Kingdom	Bacteria
Replicon accession	NC_010623
Strand	-
Start bp	112803
End bp	114113
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	59%
IMG OID	642594995
Product	phthalate 4,5-dioxygenase
Protein accession	YP_001859407
Protein GI	186472065
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGTTC CCACGCAGCC CGTGGTGTTC AAACCGAACT CGCGCGGTGC CGACCGCTAT 
CAATACCTGA CTCAGACTGA CGCGGGAACG CCCACGGGCG AACTGATGCG ACGTTACTGG 
CAACCCGTCG CGCTTATTGA CTCGTTGCCG CCGGGGGCTG CGCCGCAGCC GATCCGGATT 
CTGGGCGAAG ACCTTGTGCT CTTTCGCGAC GACAAGGATC GGGTCGGGCT TATCGACAGA 
AAGTGCGCGC ATCGATGTAC TGACCTGGCG CTTGGGCGCG TCGAGGACGG TGGAATCCGT 
TGTCCATATC ACGGATGGCT CTTCGACGTT GAAGGTCGTT GCCTGAGTCA ACCTGCTGAA 
GCTTCTGCGA CCGCGAAGGA CCGGATCCGC ATGAAGTCGT ATCCGCTTCA TGAGGCGGCG 
GGTGCATTCT GGGCATATAT GGGTCCGGGC GAGCCACCGC TTTTTCCGAA TTACCCCGCG 
CTCGCAGGCG GCGCGGAGCA TTGCTACACA ACGCGATGGT TCGGTGACTG CAACTGGTTG 
CAGGCGAGCG AGGGCAACAT CGATCCAGTT CACACTTCTT ACCTTCACCA GCTCGAACTG 
TCTAGCGAGG ACATGAAAGC ACGCTGGGGT GTGTTCTCGA ATCAATCCCG TCCCGAACTG 
GCTGTCGAGG ACACCCGATT CGGTGTCCGA CTGTACACGT TGCGCAAGAT TGACGGAACC 
GAACGTTCAT CCATTCGAAT CACGAACTTC GTCATGCCCA ACGCGTGCGC AGTCGGAGGG 
TTTGAAGGAT ACCTGGGCGA GGGGGGGCTG ACGATGCTTT GGGATGTCCC GATCGACGAC 
CAGCATCACT GGCGGTGGGA ATTCATCTTC CATCGAAGCG GAAAGTTGAA CAAGGCCTCG 
CTCGAAGCCC AGTATCAGTC GGAAAAGGAA GAAGGCGACC GGATGCGGCG CAAATGGGAG 
GACCTTTACT CCCAGGATCG CGAATCGATG AAGGGAAAGG CGTATCTGGG GCTGGGCGAG 
TGCTTCTCGG TACACGACAT TGCTATCACC CAGTCGCAAG GCACGATTCA TCAGCAGGCG 
GACGAACACT TGTCGTCTTC GGATATCGCG ATCGTCCGTG CGCGCCGGAT GCTTGACGAA 
GCCGCCCGGG TTGTTGCGGA AGGCGGCGAT CCGCGCGGCG TGGTTCGTAC AGATGCCGAC 
AATGATTTCC GCGATATGGT CGTTGTAACG GGTGAAATCG AAAACGGCGA CTCGAAGGAA 
GCCTATTGCG CTCGCTTCAC GGAAAGCCCG GATCTATTCC GTCCGCAATA G

Protein sequence

MNVPTQPVVF KPNSRGADRY QYLTQTDAGT PTGELMRRYW QPVALIDSLP PGAAPQPIRI 
LGEDLVLFRD DKDRVGLIDR KCAHRCTDLA LGRVEDGGIR CPYHGWLFDV EGRCLSQPAE 
ASATAKDRIR MKSYPLHEAA GAFWAYMGPG EPPLFPNYPA LAGGAEHCYT TRWFGDCNWL 
QASEGNIDPV HTSYLHQLEL SSEDMKARWG VFSNQSRPEL AVEDTRFGVR LYTLRKIDGT 
ERSSIRITNF VMPNACAVGG FEGYLGEGGL TMLWDVPIDD QHHWRWEFIF HRSGKLNKAS 
LEAQYQSEKE EGDRMRRKWE DLYSQDRESM KGKAYLGLGE CFSVHDIAIT QSQGTIHQQA 
DEHLSSSDIA IVRARRMLDE AARVVAEGGD PRGVVRTDAD NDFRDMVVVT GEIENGDSKE 
AYCARFTESP DLFRPQ