Gene Saro_3187 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3187
Symbol	phhA
ID	3917445
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3407491
End bp	3408429
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	66%
IMG OID	640445971
Product	phenylalanine 4-monooxygenase
Protein accession	YP_498456
Protein GI	87201199
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3186] Phenylalanine-4-hydroxylase
TIGRFAM ID	[TIGR01267] phenylalanine-4-hydroxylase, monomeric form

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGACAA CGACCGCACC CGCTTTCGAC TATGCCTGCC TACCGGAAAT GCCGGAGGGC 
GTGTTCACCG CGCCCTTGCG CCGCCCGGAC CGCGTGGGCG AGGACTGGCT CGAGCCTGCG 
CAACACCGCT ACACCGCGCA GGAGCACGCG ATCTGGGATG AGCTTTACGC CCGCCAGATG 
GAACTTCTGC CCGGCAGGGC CTGCAGCGCC TTCCTGCAGG GCCTGGAGCG GCTCGACCTC 
GGGCGCGGAG GCGTGCCCGA CTTCGCACGG CTTTCGTCCG AGCTTGGCGC GCTGACTGGC 
TGGAGCGTCG TGCCCGTGCC GATGCTGATC CCCGATCACG TGTTCTTCTG GCACCTGGCG 
AACCGCCGCT TTCCCGCAGG CAACTTCATC CGCACGCGCG AGACGTTCGA TTACATCCAG 
GAGCCCGACG TCTTCCACGA TGTCTTCGGC CACGTACCGA TGCTGACCGA CCCGACTTAT 
GCCGACTACA TGCAGGAGTA TGGCCGCGCC GGGTGGAAGG CGATGCGTTA CAACCGGCTC 
AAGGCGCTGG GCGCGCTCTA CTGGTACACG GTGGAGTTCG GGCTGGTGAT CGAGGACGGC 
GCGCCCAAGG TCTATGGTGC GGGGATCCTC TCCGGCCCGC GCGAGGCGGT GTTCGCGCTG 
GAGGGGCAGT CGCCCAACCG CATCATGCTC AACGTCGACC GGGTCATGCG CACGGATTAC 
GTGATCGACG ATCTCCAGCC GACCTATTTC GTGATCGAGA GCTTCGCGGA CCTCTATCAC 
CAGACGGTCG AGCGCGATTT CGACCGGCTC TACCGCGCGC TCGGCGCCGG GTTCACTTAT 
GCCAACACTG CGGTGATCGA CGTGGACGAC GTGCTGCACC GGGGCACGCT GGAATACCAC 
CTGCGGGGCG GGCGCGGATC GGGCGCAATT CCGGTCTGA

Protein sequence

MLTTTAPAFD YACLPEMPEG VFTAPLRRPD RVGEDWLEPA QHRYTAQEHA IWDELYARQM 
ELLPGRACSA FLQGLERLDL GRGGVPDFAR LSSELGALTG WSVVPVPMLI PDHVFFWHLA 
NRRFPAGNFI RTRETFDYIQ EPDVFHDVFG HVPMLTDPTY ADYMQEYGRA GWKAMRYNRL 
KALGALYWYT VEFGLVIEDG APKVYGAGIL SGPREAVFAL EGQSPNRIML NVDRVMRTDY 
VIDDLQPTYF VIESFADLYH QTVERDFDRL YRALGAGFTY ANTAVIDVDD VLHRGTLEYH 
LRGGRGSGAI PV