Gene EcHS_A4065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4065
Symbol	ubiD
ID	5594373
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4055346
End bp	4056839
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	54%
IMG OID	640923169
Product	3-octaprenyl-4-hydroxybenzoate decarboxylase
Protein accession	YP_001460635
Protein GI	157163317
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGCCA TGAAATATAA CGATTTACGC GACTTCCTGA CGCTGCTTGA ACAGCAGGGT 
GAGCTAAAAC GTATCACGCT CCCGGTGGAT CCGCATCTGG AAATCACTGA AATTGCTGAC 
CGCACTTTGC GTGCCGGTGG GCCTGCGCTG TTGTTCGAAA ACCCTAAAGG CTACTCAATG 
CCGGTGCTGT GCAACCTGTT CGGTACGCCA AAGCGCGTGG CGATGGGCAT GGGGCAGGAA 
GATGTTTCGG CGCTGCGTGA AGTTGGTAAA TTATTGGCGT TTCTGAAAGA GCCGGAGCCG 
CCAAAAGGTT TCCGCGACCT GTTTGATAAA CTGCCGCAGT TTAAGCAAGT ATTGAACATG 
CCGACAAAGC GGCTGCGTGG TGCGCCCTGC CAACAAAAAA TCGTCTCTGG CGATGACGTC 
GATCTCAATC GCATTCCCAT TATGACCTGC TGGCCGGAAG ATGCCGCACC GCTGATTACC 
TGGGGGCTGA CAGTGACGCG CGGCCCGCAT AAAGAGCGGC AGAATCTGGG CATTTATCGC 
CAGCAGCTGA TTGGTAAAAA CAAACTGATT ATGCGCTGGC TGTCGCATCG CGGCGGCGCG 
CTGGATTATC AGGAGTGGTG TGCGGCGCAT CCGGGCGAAC GTTTCCCGGT TTCTGTGGCG 
CTGGGTGCCG ATCCTGCCAC GATTCTCGGT GCAGTCACCC CCGTTCCGGA TACGCTTTCA 
GAGTATGCGT TTGCCGGATT GCTACGCGGC ACCAAAACCG AAGTAGTAAA GTGTATTTCC 
AATGACCTCG AAGTGCCAGC CAGTGCCGAA ATCGTCCTGG AAGGGTATAT CGATCCTGGT 
GAGATGGCGC CGGAAGGGCC GTATGGTGAC CACACAGGTT ACTATAATGA AGTCGATAGT 
TTCCCGGTGT TTACCGTGAC GCATATTACC CAGCGTGAAG ATGCGATTTA CCATTCCACC 
TATACCGGGC GTCCGCCAGA TGAGCCCGCG GTACTGGGCG TGGCGTTGAA CGAAGTGTTT 
GTACCGATTC TGCAAAAACA GTTCCCGGAA ATTGTCGATT TTTACCTGCC GCCGGAAGGC 
TGTTCTTATC GTCTGGCGGT AGTGACGATC AAAAAACAGT ACGCCGGACA CGCGAAGCGC 
GTCATGATGG GCGTCTGGTC GTTCTTACGC CAGTTTATGT ACACTAAATT TGTGATCGTT 
TGCGATGATG ACGTCAACGC ACGCGACTGG AACGATGTGA TTTGGGCGAT TACCACCCGT 
ATGGACCCGG CGCGGGATAC TGTTCTGGTA GAAAATACGC CTATTGATTA TCTGGATTTT 
GCCTCGCCTG TCTCCGGGCT GGGTTCAAAA ATGGGGCTGG ATGCCACGAA TAAATGGCCG 
GGGGAAACCC AGCGTGAATG GGGACGTCCC ATCAAAAAAG ATCCAGATGT TGTCGCGCAT 
ATTGACGCCA TCTGGGATGA ACTGGCTATT TTTAACAACG GTAAAAGCGC CTGA

Protein sequence

MDAMKYNDLR DFLTLLEQQG ELKRITLPVD PHLEITEIAD RTLRAGGPAL LFENPKGYSM 
PVLCNLFGTP KRVAMGMGQE DVSALREVGK LLAFLKEPEP PKGFRDLFDK LPQFKQVLNM 
PTKRLRGAPC QQKIVSGDDV DLNRIPIMTC WPEDAAPLIT WGLTVTRGPH KERQNLGIYR 
QQLIGKNKLI MRWLSHRGGA LDYQEWCAAH PGERFPVSVA LGADPATILG AVTPVPDTLS 
EYAFAGLLRG TKTEVVKCIS NDLEVPASAE IVLEGYIDPG EMAPEGPYGD HTGYYNEVDS 
FPVFTVTHIT QREDAIYHST YTGRPPDEPA VLGVALNEVF VPILQKQFPE IVDFYLPPEG 
CSYRLAVVTI KKQYAGHAKR VMMGVWSFLR QFMYTKFVIV CDDDVNARDW NDVIWAITTR 
MDPARDTVLV ENTPIDYLDF ASPVSGLGSK MGLDATNKWP GETQREWGRP IKKDPDVVAH 
IDAIWDELAI FNNGKSA