Gene Dshi_3100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_3100
Symbol	ubiA
ID	5710952
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	3267233
End bp	3268201
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	69%
IMG OID	641269027
Product	4-hydroxybenzoate polyprenyltransferase
Protein accession	YP_001534434
Protein GI	159045640
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0382] 4-hydroxybenzoate polyprenyltransferase and related prenyltransferases
TIGRFAM ID	[TIGR01474] 4-hydroxybenzoate polyprenyl transferase, proteobacterial

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	53
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACG AGGCGCAGAC ACCAGACGGC GGAACCGTCG CCGACGCGCC CGCGGATAAC 
TGGGTCGACC GCTACGCGCC GCCCGCAACC CGCCCCTACC TGCGGCTCAG CCGCGCGGAC 
CGGCCGATCG GCACCTGGCT TTTGCTGATC CCCTGCTGGT GGGGCGCTCT TCTGGGGGCG 
GCGGCGGGTG ACGGGTTCGA CCGCGGCACT GCCTGGATCA TGGTCGGCTG CGGGATTGGC 
GCCTTCCTGA TGCGCGGCGC GGGCTGCACC TGGAACGATA TCACCGACCG CGACTTCGAC 
GCAAAGGTCG CACGCACGCG CTCCCGCCCG ATCCCGTCGG GTCAGGTCAG CGTGCGCGGC 
GCGCTGGTCT GGATGGTGGT GCAGGCGCTG CTGGCCTTCG GCATCCTGCT GAGCTTCAAC 
CTGCCCGCCA TCGGGCTGGG CATCGCCTCG CTGGCGCTGG TCTGCGTCTA TCCCTTCGCC 
AAACGGTTCA CCTGGTGGCC GCAGATCTTC CTGGGGCTTG CGTTCAACTG GGGCGCGCTG 
CTGGCCTGGA CGGCCGAGAC CGGTACTCTG CTCGATGCGC CCAGCGTGCT GCTCTATGTC 
GCCGGGATCG CCTGGACCCT GTTCTACGAC ACGATCTACG CCCATCAGGA CACCGAGGAC 
GATGCCCTGA TCGGCGTAAA ATCGACCGCG CGGCTTTTCG GCGATCGATC GCGGCGGTGG 
TTGGGGCTGT TCCTGATCGC GGCAACCGTG CTGGCGGGCG GGGCCGTCAT TGCCGCGCTG 
GCCCCACTGG ATGCGCCCCT GGCGCTCGCG CTCGGGCTCG GCGGGGTCTG GGCCTTCGGA 
TGGCACATGG TGTGGCAGCT GCGGCAGCTC GACCCGAACG ACCCCGGCAA CTGCCTGCGG 
CTGTTTCGGT CCAATCGGGA CGCCGGTCTG ATCCTTGCGC TGTTTCTCGC CCTGACCTTG 
CTCGCTTGA

Protein sequence

MSNEAQTPDG GTVADAPADN WVDRYAPPAT RPYLRLSRAD RPIGTWLLLI PCWWGALLGA 
AAGDGFDRGT AWIMVGCGIG AFLMRGAGCT WNDITDRDFD AKVARTRSRP IPSGQVSVRG 
ALVWMVVQAL LAFGILLSFN LPAIGLGIAS LALVCVYPFA KRFTWWPQIF LGLAFNWGAL 
LAWTAETGTL LDAPSVLLYV AGIAWTLFYD TIYAHQDTED DALIGVKSTA RLFGDRSRRW 
LGLFLIAATV LAGGAVIAAL APLDAPLALA LGLGGVWAFG WHMVWQLRQL DPNDPGNCLR 
LFRSNRDAGL ILALFLALTL LA