Gene EcSMS35_0685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_0685
Symbol	ubiF
ID	6144074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	694558
End bp	695733
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	57%
IMG OID	641615575
Product	2-octaprenyl-3-methyl-6-methoxy-1,4-benzoquinol hydroxylase
Protein accession	YP_001742781
Protein GI	170680248
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID	[TIGR01988] Ubiquinone biosynthesis hydroxylase, UbiH/UbiF/VisC/COQ6 family

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00002921
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	65
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAATC AACCAACGGA AATTGCCATT GTCGGCGGAG GAATGGTCGG CGGCGCACTG 
GCGCTGGGAC TGGCTCAGCA CGGATTTTCG GTAATGGTTA TCGAACATGC CCAACCTGCA 
CCGTTTGTCG CTGACAGCCA GCCGGACGTG CGGATCTCGG CGATTAGTGC GGCTTCGGTA 
TCATTGCTTA AAGGGTTAGG GGTCTGGGAT GCAGTACAGG CTATGCGTTG CCATCCTTAC 
CGCAGACTGG AAACGTGGGA GTGGGAAACG GCGCATGTGG TGTTTGACGC CGCTGAACTT 
AAGCTACCGT TGCTTGGCTA CATGGTGGAA AACACTGTCC TGCAACAGGC GCTGTGGCAG 
GCGCTGGAAG CGCATCCGAA AGTAACGTTA CGTGTGCCAG GCTCGCTGAT TGCGCTGCAT 
CGCCATAATG ATCTTCAGGA GCTGGAACTG AAGGGCGGTG AAACGATCCG CGCGAAGCTG 
GTGATTGGTG CCGACGGCGC AAATTCGCAG GTGCGGCAGA TGGCGGGAAT TGGCGTTCAT 
GCCTGGCAGT ATGCACAGTC GTGTATGTTG ATTAGCGTAC AGTGCGAGAA CGATCCCGGC 
GATAGCACCT GGCAGCAATT TACCCCGGAC GGACCGCGTG CGTTTCTGCC GTTGTTTGAT 
AACTGGGCAT CGCTGGTGTG GTATGACTCT CCGGCGCGCA TTCGCCAGTT GCAGAATATG 
AATATGGCGC AGCTACAGGC GGAAATCGCG AAGCATTTCC CGTCGCGTCT GGGTTACGTG 
ACACCGCTTG CCGCGGGGGC GTTTCCGCTG ACACGTCGCC ATGCGTTGCA GTATGTTCAG 
CCGGGATTGG CACTGGTGGG AGATGCCGCG CATACCATCC ATCCGCTGGC GGGGCAGGGG 
GTGAATCTTG GTTATCGTGA TGTCGATGCC CTGATTGACG TTCTGGTGAA CGCCCGCAGC 
TACGGCGAAG CGTGGGCCAG TTATCCTGTG CTCAAGCGTT ACCAGATGCG GCGCATGGCG 
GATAACTTCA TTATGCAAAG CGGTATGGAT CTGTTTTATG CCGGATTCAG CAATAATCTG 
CCACCACTGC GTTTTATGCG TAATCTCGGA TTAATGGCGG CGGAGCGTGC TGGCGTGTTG 
AAACGTCAGG CGCTGAAATA TGCGTTAGGG TTGTAG

Protein sequence

MTNQPTEIAI VGGGMVGGAL ALGLAQHGFS VMVIEHAQPA PFVADSQPDV RISAISAASV 
SLLKGLGVWD AVQAMRCHPY RRLETWEWET AHVVFDAAEL KLPLLGYMVE NTVLQQALWQ 
ALEAHPKVTL RVPGSLIALH RHNDLQELEL KGGETIRAKL VIGADGANSQ VRQMAGIGVH 
AWQYAQSCML ISVQCENDPG DSTWQQFTPD GPRAFLPLFD NWASLVWYDS PARIRQLQNM 
NMAQLQAEIA KHFPSRLGYV TPLAAGAFPL TRRHALQYVQ PGLALVGDAA HTIHPLAGQG 
VNLGYRDVDA LIDVLVNARS YGEAWASYPV LKRYQMRRMA DNFIMQSGMD LFYAGFSNNL 
PPLRFMRNLG LMAAERAGVL KRQALKYALG L