Gene Namu_3851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3851
Symbol
ID	8449470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4222533
End bp	4223726
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	68%
IMG OID	645042900
Product	4-hydroxybenzoate 3-monooxygenase
Protein accession	YP_003203136
Protein GI	258653980
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID	[TIGR02360] 4-hydroxybenzoate 3-monooxygenase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.000154299
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCACCC CGGAAATCCT CACCACCCGC GTCGGAATCG TCGGCGGCGG TCCCGCCGGC 
CTGATGCTGT CCCACCTGCT GGCCAAGGCC GGCGTCGATT CGATCGTGGT CGAGAAGCGC 
GATCACGAGA CCATCCGAAC CACCCACCGG GCCGGCATTC TCGAGCACGG CTCGGTGTCG 
ATGCTGGTGG ATTCCGGGGT GTCCGACCGG GTGCTGCGAG AGGGACACCG GCACGAGGGC 
ATCGACCTGC GCTTCGGCGG GGTGAGCCAC CGGCTCGACT TCACCGACCT GGTCGGGGAG 
GCCGTGTGGC TGTACCCGCA GAACGAGGTG TTCGTCGACC TGGCCGCCGC CCGTGAGCGC 
GACGGCGGGC AGGTGTTCTG GTCGGTCACC GACACCGCGG TCCTGGATCA GACGACGGAC 
ACCCCCAAGA TCCTGTTCAC CGACGCGCAG GGGCAGGCCC GGGAGATCCA CTGCGACATC 
CTGGTCGGTG CCGACGGCTC GCAGGGCGTC TGCAAGTGGT CCATCCCGCA GGACCAGCGG 
GTGGACAACT TCGTGGAGTA CCCGTTCGCC TGGTTCGGGA TCCTGTGCGA GGCGCCGCCC 
AGCGCCGACG AGTTGATCTA CTGCAACTCC GAGCACGGAT TCGCGCTGAT CAGCCAGCGG 
GACGCGAACA TCCAGCGGAT GTACTTCCAG TGCGACCCGA ACGAGGACGT CAACGCCTGG 
TCGGAGGAGG CCATCTGGGC CGAGCTGCAA AAGCGCCTCG ACGGCCCGGA CGGGTTCCAG 
CTCAAGCAGG GCCGGATCTT CGACAAGACG GTGCTGCGCT TCCGCAGCTA CGTCTGCGAG 
CCCCTGCGCT ACGGCAACAT GTTCCTGGCC GGCGACGCCG GGCACACCGT GCCGCCGACC 
GGGGCCAAGG GACTGAACCT GGCCCTGGCC GACGTGCGGG TGCTGTTCGA GGGCATCGAC 
TCGTACTACT CGACCGGATC ACGAGATCTG CTGGACGCCT ACAGCGACCG GGCCCTGCAA 
CGGATCTGGA AGGCGCAGAA CTTCTCGTAC TGGATGACCA GCATGCTGCA CCACCGCGCG 
GACGCGACCC CGTTCGAGCG TCAGCGGCAA CTCGGCGAGC TGGCCGGGGT GGTCGCGTCC 
CGGCACGGCT CGGCCTACCT GGCCGAGGCC TACACCGGCT GGCCGACCGC CTGA

Protein sequence

MSTPEILTTR VGIVGGGPAG LMLSHLLAKA GVDSIVVEKR DHETIRTTHR AGILEHGSVS 
MLVDSGVSDR VLREGHRHEG IDLRFGGVSH RLDFTDLVGE AVWLYPQNEV FVDLAAARER 
DGGQVFWSVT DTAVLDQTTD TPKILFTDAQ GQAREIHCDI LVGADGSQGV CKWSIPQDQR 
VDNFVEYPFA WFGILCEAPP SADELIYCNS EHGFALISQR DANIQRMYFQ CDPNEDVNAW 
SEEAIWAELQ KRLDGPDGFQ LKQGRIFDKT VLRFRSYVCE PLRYGNMFLA GDAGHTVPPT 
GAKGLNLALA DVRVLFEGID SYYSTGSRDL LDAYSDRALQ RIWKAQNFSY WMTSMLHHRA 
DATPFERQRQ LGELAGVVAS RHGSAYLAEA YTGWPTA