Gene RoseRS_2569 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_2569
Symbol
ID	5209538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	3184847
End bp	3186412
Gene Length	1566 bp
Protein Length	521 aa
Translation table	11
GC content	60%
IMG OID	640596173
Product	4-hydroxyphenylacetate 3-hydroxylase
Protein accession	YP_001276895
Protein GI	148656690
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2368] Aromatic ring hydroxylase
TIGRFAM ID	[TIGR02310] 4-hydroxyphenylacetate 3-monooxygenase, oxygenase component

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGTCG AAACAGTAGA GCGAACGACA CTGCCCCTCA CCGGCGAGGA GTATCTGGAA 
AGTCTGCGGG ATGGGCGCGA AATCTGGATC TATGGCGAGC GAGTCAAAGA TATCACCACC 
CATCCGGCGT TCCGCAACGC AACCCGTATG GTTGCCCGCC TCTACGATGC ACTGCATGAC 
CCTGAGAAGC AGGCGGTGCT GACCTGTCCG ACCGATACCG GCAACGGCGG CTTTACGCAC 
AAGTTTTTCC GCGCGTCGCG CAGCGCGGAG GAATTGGTTG GCGCACGCGA TGCAATTGCC 
GAGTGGGCGC GGTTGACGTA TGGCTGGATG GGGCGCAGTC CTGATTACAA AGCCGCCTTT 
CTGGCGACGC TCGGCGCGAA TGCGGAGTTC TACACCCCCT ATCAGGAAAA TGCACGCCGC 
TGGTACCGCG AGTCGCAGGA GCGAGTGCTC TACTTCAACC ATGCGATTGT CAACCCGCCG 
ATTGATCGCA ACCGCTCCCC GGATGAAGTC CGTGACGTGT ACATGCACGT CGAGCGCGAG 
ACCGATGCCG GATTGATCGT CAGCGGCGCC AAGGTGGTCG CCACCGGCTC GGCGCTGACC 
CACTACAATT TCATTGCCCA CTACGGTCCA CTGCCGATCA AGAGCAAAGA GTTCGCCCTG 
ATCTTCATCG TGCCGATGGA TGCGCCGGGC GTCAAACTGA TCGCCCGCCC GTCGTATGAG 
ATGGCGGCGG AGGTGATGGG CAGCCCATTC GATTATCCGC TTTCGAGTCG CCTCGATGAG 
AATGACTCGG TGATGGTCTT CGACCAGGTG CTGATCCCCT GGGAGAATGT CTTTGTCTAC 
GGCGATGTTG AGAAGGTGAA TGCCTTCTTC CCGCTCTCCG GCTTTATTCC GCGCTTCACG 
TTCCACGGCT GCACCCGCAT GGCGGTGAAA CTCGACTTTA TCGCCGGTCT GTTCCTGAAG 
GCGATCGACG CAACAGGGGC GAAGGATTTT CGCGGCGTTC AGGCGCGCGT CGGCGAGGTG 
CTTGCCTGGC GGAACCTGTT CTGGGCGATC AGCGACGCCA TGGCGCGCAC GCCGATTCCC 
TGGAACGAGG GGGCGGTGCT GCCGAATCTG GATTACGGTC TGGCGTATCG CGTCTTCGCC 
ACCGTCGCGT ATCCGCGCAT CAAGGAACTG ATCGAGAATG ATGTCGCCAG CGCGCTCATC 
TATCTCAACT CGCACGCCGT CGATTTCAAG ACGCCGGAAA TACGCGGCTA CCTGGATAAG 
TATCTGCGCG GGTCGAACGG CTACTCGTCG CTGGATCGCG TCAAACTGAT GAAGTTGTTG 
TGGGATGCGA TCGGTTCGGA GTTTGGCGGA CGGCACGAAC TCTATGAGCG GAACTATGCC 
GGCAACCACG AGAACATTCG CCTGGAAGTG TTGCTGACGG CGATGGCAAC CGGCGCTGCC 
GATCGCTACA AAGGATTCGC CGATCAGTGT CTCAACGAGT ACGATCTCGA CGGCTGGACG 
GTTCCCGATC TGATCAACCC CGACGATGTG AATATCGTGA TGCAACGGTT CGGCGCCAGA 
CAGTAG

Protein sequence

MTVETVERTT LPLTGEEYLE SLRDGREIWI YGERVKDITT HPAFRNATRM VARLYDALHD 
PEKQAVLTCP TDTGNGGFTH KFFRASRSAE ELVGARDAIA EWARLTYGWM GRSPDYKAAF 
LATLGANAEF YTPYQENARR WYRESQERVL YFNHAIVNPP IDRNRSPDEV RDVYMHVERE 
TDAGLIVSGA KVVATGSALT HYNFIAHYGP LPIKSKEFAL IFIVPMDAPG VKLIARPSYE 
MAAEVMGSPF DYPLSSRLDE NDSVMVFDQV LIPWENVFVY GDVEKVNAFF PLSGFIPRFT 
FHGCTRMAVK LDFIAGLFLK AIDATGAKDF RGVQARVGEV LAWRNLFWAI SDAMARTPIP 
WNEGAVLPNL DYGLAYRVFA TVAYPRIKEL IENDVASALI YLNSHAVDFK TPEIRGYLDK 
YLRGSNGYSS LDRVKLMKLL WDAIGSEFGG RHELYERNYA GNHENIRLEV LLTAMATGAA 
DRYKGFADQC LNEYDLDGWT VPDLINPDDV NIVMQRFGAR Q