Gene BURPS1710b_0206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_0206
Symbol	phhA
ID	3691168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	214145
End bp	215155
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	66%
IMG OID	637726662
Product	phenylalanine 4-monooxygenase
Protein accession	YP_331622
Protein GI	76808615
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3186] Phenylalanine-4-hydroxylase
TIGRFAM ID	[TIGR01267] phenylalanine-4-hydroxylase, monomeric form

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATGCGCA ATTATCGCAT TTATCCATAC ACAATCGCCC ATTTTGCGCC CAAACCGCGC 
GAGCCCCGCT CTACACTTGC ATGCATCCCC ACCACTGATG CGAAGCAGGG CTACCCCATG 
TCCACGGTCG TTACCGCGAA ACTGAAGGAA CAGTTCGACG CGGGCCTCGA AACCCGCGCC 
GATTTCACCA TCGATCAGCC GCTCGCCCGC TACGGCGACG TCGACCACGC GGTGTGGACG 
CAGTTGTATA CGCGGCAGGC GGCGCTGCTG CGCGGCCGTG CATGCGACGC GTTCATCGAG 
GGCCTCGCGC GCATCGGCCT CGCGCCCGAT CGCGTGCCGT CGTTCGCCGA CGTGAACCGG 
CGGCTCGAGC CCGCAACCGG CTGGCGCATC GTCGCGGTGC CGGGCCTCGT GCCGGACGCC 
GTTTTCTTCG AGCATCTCGC GAACCGGCGG TTTCCGGTCA CCTGGTGGAT GCGCCGCCCG 
GACCAGCTCG ATTATCTACA GGAGCCGGAC TGCTTCCACG ATCTGTTCGG CCACGTGCCG 
CTGCTGATCG ATCCCGTATT CGCCGACTAC ATGCACGCAT ACGGCCGCGC GGCGCTTCGC 
GTCGCCGACG ACGCAAGCGC GCTCGCGCTC CTTGCGCGCC TCTATTGGTA TACGGTCGAA 
TTCGGCCTGA TTCGCGACAC GCGCGGCGAA AACGGGCTGC GGATCTACGG CGCGGGCATC 
GTGTCGAGCA AGGGCGAAAC GCTCTACAGC CTCGAAAGCA CGTCGCCGAA CCGGATCGGC 
TTCGATCTCG AACGCGTGAT GCGGACCCGA TACCGGATCG ACACGTTCCA GAAGACCTAC 
TTCGTGATCG ACGATTTCGC GCAACTCTTC GCGCTCGCCG ACCTCGACGC GCGCGCGCTC 
GCCGCGCGGC TCGCCGGCGC GCCCGAGCAC GCGGCGGGCG CGGTGCTTGA CGGCGATCAT 
GTGCTCACGC GCGGCACCGG TGAAGGCTGG GCAGCCGATG CAGACGCTTG A

Protein sequence

MMRNYRIYPY TIAHFAPKPR EPRSTLACIP TTDAKQGYPM STVVTAKLKE QFDAGLETRA 
DFTIDQPLAR YGDVDHAVWT QLYTRQAALL RGRACDAFIE GLARIGLAPD RVPSFADVNR 
RLEPATGWRI VAVPGLVPDA VFFEHLANRR FPVTWWMRRP DQLDYLQEPD CFHDLFGHVP 
LLIDPVFADY MHAYGRAALR VADDASALAL LARLYWYTVE FGLIRDTRGE NGLRIYGAGI 
VSSKGETLYS LESTSPNRIG FDLERVMRTR YRIDTFQKTY FVIDDFAQLF ALADLDARAL 
AARLAGAPEH AAGAVLDGDH VLTRGTGEGW AADADA