Gene SNSL254_A1194 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1194
Symbol	hpaB
ID	6484422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	1188062
End bp	1189624
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	53%
IMG OID	642736596
Product	4-hydroxyphenylacetate 3-monooxygenase, oxygenase component
Protein accession	YP_002040354
Protein GI	194444049
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2368] Aromatic ring hydroxylase
TIGRFAM ID	[TIGR02310] 4-hydroxyphenylacetate 3-monooxygenase, oxygenase component

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	0.955757
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCTG AAGATTTTCG TACTGATAAC AAGCGTCCGT TAACGGGCGA AGAGTATTTA 
AAAAGCCTGC AGGACGGGCG GGAAATTTAT ATTTACGGCG AACGCGTTAA AGATGTTACG 
ACACATCCGG CATTCCGCAA TGCCGCAGCC TCTGTCGCAC AACTGTATGA CGCATTACAT 
AAACCGTCGA TGCAAGATAC CCTGTGCTGG AATACCGATA CCGGCAGCGG CGGTTATACG 
CATAAATTTT TCCGCGTGGC GAAAAGCGCA GACGATCTGC GCCAACAGCG TGATGCTATC 
GCCGAGTGGT CACGCCTGAG TTACGGCTGG ATGGGACGCA CACCGGATTA CAAAGCCGCC 
TTTGGTTGCG CCCTGGGCGC TAACCCAGCC TTCTACGGCC AGTTTGAGCA GAACGCCCGC 
AACTGGTACA CCCGTATTCA GGAGACCGGC CTGTACTTTA ACCATGCAAT CGTCAACCCG 
CCCATTGACC GCCACAAACC TGCCGACGAA GTGAAAGACG TCTATATCAA GCTGGAGAAA 
GAGACGGACG CCGGGATTAT TGTCAGCGGG GCGAAAGTCG TCGCCACTAA CTCCGCCCTG 
ACTCACTACA ACATGATTGG TTTCGGCTCA GCCCAGGTGA TGGGCGAAAA CCCGGACTTT 
GCTCTGATGT TTGTCGCGCC AATGGATGCC GAAGGCGTAA AACTTATTTC GCGCGCCTCG 
TATGAAATGG TCGCGGGCGC GACGGGCTCG CCGTTTGATT ATCCACTCTC CAGCCGCTTT 
GATGAAAACG ATGCCATTCT GGTGATGGAC AAGGTGTTGA TCCCGTGGGA AAACGTGTTG 
ATTTACCGTG ATTTCGATCG TTGCCGTCGC TGGACGATGG AAGGCGGCTT TGCCCGTATG 
TATCCACTGC AAGCCTGTGT TCGTCTGGCG GTTAAACTTG ATTTCATTAC CGCGCTGCTG 
AAAAAATCGC TCGAATGTAC GGGTACCGTA GAGTTCCGGG GTGTGCAGGC CGATCTCGGC 
GAAGTCGTGG CCTGGCGCAA TATGTTCTGG GCATTGAGCG ATTCTATGTG TTCTGAAGCA 
ACCCCGTGGG TAAACGGCGC CTGGCTGCCG GACCACGCCG CGCTGCAAAC CTATCGTGTG 
ATGGCCCCAA TGGCCTACGC GAAAATTAAA AATATTATTG AACGTAACGT TACCAGCGGC 
CTGATTTACC TGCCTTCCAG CGCCCGCGAT CTGAATAATC CGCAAATCGA CCAGTACCTG 
GCGAAATACG TACGCGGCTC TAACGGAATG GACCATGTTG AACGTATCAA AATTCTTAAA 
TTGATGTGGG ATGCCATCGG TAGCGAGTTT GGCGGTCGCC ATGAGCTGTA CGAGATTAAC 
TACTCGGGCA GCCAGGATGA AATTCGTCTG CAGTGCCTGC GTCAGGCCCA GAGCTCCGGC 
AATATGGATA AGATGATGGC AATGGTCGAT CGCTGCCTCT CCGAATACGA TCAGAATGGC 
TGGACGGTTT CGCATTTGCA CAATAACGAC GACATCAATC AACTGGATAA GCTGCTGAAA 
TAA

Protein sequence

MKPEDFRTDN KRPLTGEEYL KSLQDGREIY IYGERVKDVT THPAFRNAAA SVAQLYDALH 
KPSMQDTLCW NTDTGSGGYT HKFFRVAKSA DDLRQQRDAI AEWSRLSYGW MGRTPDYKAA 
FGCALGANPA FYGQFEQNAR NWYTRIQETG LYFNHAIVNP PIDRHKPADE VKDVYIKLEK 
ETDAGIIVSG AKVVATNSAL THYNMIGFGS AQVMGENPDF ALMFVAPMDA EGVKLISRAS 
YEMVAGATGS PFDYPLSSRF DENDAILVMD KVLIPWENVL IYRDFDRCRR WTMEGGFARM 
YPLQACVRLA VKLDFITALL KKSLECTGTV EFRGVQADLG EVVAWRNMFW ALSDSMCSEA 
TPWVNGAWLP DHAALQTYRV MAPMAYAKIK NIIERNVTSG LIYLPSSARD LNNPQIDQYL 
AKYVRGSNGM DHVERIKILK LMWDAIGSEF GGRHELYEIN YSGSQDEIRL QCLRQAQSSG 
NMDKMMAMVD RCLSEYDQNG WTVSHLHNND DINQLDKLLK