Gene SeD_A1174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1174
Symbol	hpaB
ID	6873563
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	1164223
End bp	1165785
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	53%
IMG OID	642784357
Product	4-hydroxyphenylacetate 3-monooxygenase, oxygenase component
Protein accession	YP_002215030
Protein GI	198245049
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2368] Aromatic ring hydroxylase
TIGRFAM ID	[TIGR02310] 4-hydroxyphenylacetate 3-monooxygenase, oxygenase component

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.165966
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCTG AAGATTTTCG TACTGATAAC AAGCGTCCGT TAACGGGCGA AGAGTATTTA 
AAAAGCCTGC AGGACGGGCG GGAAATTTAT ATTTACGGCG AACGCGTTAA AGATGTTACG 
ACACACCCAG CATTCCGCAA TGCCGCAGCC TCTGTCGCAC AACTGTATGA CGCATTACAT 
AAACCGTCGA TGCAAGATAC CCTGTGCTGG AATACCGATA CCGGCAGCGG CGGTTATACG 
CATAAATTTT TCCGCGTGGC AAAAAGCGCA GACGATCTGC GCCAACAGCG TGATGCTATC 
GCCGAGTGGT CACGCCTGAG TTACGGCTGG ATGGGACGCA CACCGGATTA CAAAGCCGCC 
TTTGGCTGCG CTCTGGGCGC TAACCCAGCC TTCTACGGCC AGTTTGAGCA GAACGCCCGT 
AACTGGTACA CCCGTATTCA GGAGACCGGC CTGTACTTTA ACCATGCTAT CGTCAACCCG 
CCCATTGACC GCCACAAACC TGCCGACGAA GTGAAAGACG TCTATATCAA GCTGGAGAAA 
GAGACGGACG CCGGGATTAT TGTCAGCGGG GCGAAAGTTG TCGCCACTAA CTCCGCCCTG 
ACTCACTACA ACATGATTGG TTTCGGCTCA GCCCAGGCGA TGGGCGAAAA CCCGGATTTT 
GCTCTGATGT TTGTCGCGCC AATGGATGCC GAAGGCGTAA AACTTATTTC ACGCGCCTCG 
TATGAAATGG TCGCGGGCGC GACGGGCTCG CCGTTTGATT ATCCACTCTC CAGCCGCTTT 
GATGAAAACG ATGCCATTCT GGTGATGGAC AAGGTGTTGA TCCCGTGGGA AAACGTGTTG 
ATTTACCGTG ATTTCGATCG TTGTCGTCGC TGGACGATGG AAGGCGGCTT TGCCCGTATG 
TATCCACTGC AAGCCTGTGT TCGTCTGGCG GTTAAACTTG ATTTCATTAC CGCGCTGCTG 
AAAAAATCGC TCGAATGTAC GGGTACCGTA GAGTTCCGGG GCGTGCAGGC CGATCTCGGC 
GAAGTCGTGG CCTGGCGCAA TATGTTCTGG GCATTGAGCG ATTCTATGTG TTCCGAAGCA 
ACCCCGTGGG TAAACGGCGC CTGGCTACCG GACCACGCCG CGCTGCAAAC CTATCGTGTG 
ATGGCCCCAA TGGCCTACGC GAAAATTAAA AATATTATTG AACGTAACGT TACCAGCGGC 
CTGATTTACC TGCCTTCCAG CGCCCGCGAT CTGAATAATC CGCAAATCGA CCAGTACCTG 
GCGAAATACG TACGCGGCTC TAACGGAATG GACCATGTTG AACGTATCAA AATTCTTAAA 
TTGATGTGGG ATGCCATCGG CAGCGAGTTT GGCGGTCGCC ATGAGCTGTA CGAGATTAAC 
TACTCGGGCA GCCAGGATGA AATTCGTCTG CAGTGCCTGC GTCAGGCCCA GAGCTCCGGC 
AATATGGACA AGATGATGGC AATGGTCGAT CGCTGCCTCT CCGAATACGA TCAGAATGGC 
TGGACGGTTT CGCATTTGCA CAATAACGAC GACATCAATC AACTGGATAA GCTGCTGAAA 
TAA

Protein sequence

MKPEDFRTDN KRPLTGEEYL KSLQDGREIY IYGERVKDVT THPAFRNAAA SVAQLYDALH 
KPSMQDTLCW NTDTGSGGYT HKFFRVAKSA DDLRQQRDAI AEWSRLSYGW MGRTPDYKAA 
FGCALGANPA FYGQFEQNAR NWYTRIQETG LYFNHAIVNP PIDRHKPADE VKDVYIKLEK 
ETDAGIIVSG AKVVATNSAL THYNMIGFGS AQAMGENPDF ALMFVAPMDA EGVKLISRAS 
YEMVAGATGS PFDYPLSSRF DENDAILVMD KVLIPWENVL IYRDFDRCRR WTMEGGFARM 
YPLQACVRLA VKLDFITALL KKSLECTGTV EFRGVQADLG EVVAWRNMFW ALSDSMCSEA 
TPWVNGAWLP DHAALQTYRV MAPMAYAKIK NIIERNVTSG LIYLPSSARD LNNPQIDQYL 
AKYVRGSNGM DHVERIKILK LMWDAIGSEF GGRHELYEIN YSGSQDEIRL QCLRQAQSSG 
NMDKMMAMVD RCLSEYDQNG WTVSHLHNND DINQLDKLLK