Gene ECH74115_5282 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_5282
Symbol	ubiD
ID	6967477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4924412
End bp	4925905
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	52%
IMG OID	643388946
Product	3-octaprenyl-4-hydroxybenzoate decarboxylase
Protein accession	YP_002273360
Protein GI	209397095
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.064348
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGCCA TGAAATATAA CGATTTACGC GACTTCTTGA CGTTGCTTGA ACAGCAGGGT 
GAGCTAAAAC GTATCACGCT CCCGGTGGAC CCGCATCTGG AAATCACTGA AATTGCTGAC 
CGCACGCTGC GTGCTGGTGG GCCTGCGCTG TTGTTTGAAA ACCCTAAAGG GTACTCAATG 
CCGGTGCTGT GCAACTTGTT CGGTACGCCA AAGCGCGTAG CGATGGGTAT GGGCCAGGAA 
GATGTTTCAG CACTGCGTGA AGTCGGTAAA TTATTAGCAT TTCTGAAAGA ACCAGAGCCG 
CCAAAAGGTT TTCGCGATCT GTTTGATAAG CTGCCGCAGT TTAAGCAGGT GTTAAACATG 
CCGACAAAGC GACTGCGCGG TGCACCCTGC CAACAAAAAA TCGTCTCTGG CGATGACGTC 
GATCTCAACC GTATTCCCAT TATGACCTGT TGGCCGGAAG ATGCCGCGCC GCTGATTACA 
TGGGGGCTAA CCGTTACACG TGGCCCTCAT AAAGAGCGAC AGAATCTGGG CATTTATCGC 
CAGCAACTGA TTGGTAAAAA CAAGCTGATT ATGCGTTGGC TGTCGCATCG CGGCGGCGCG 
CTGGATTATC AGGAGTGGTG TGCGGCGCAT CCAGGTGAAC GTTTCCCGAT CTCTGTGGCG 
TTGGGCGCTG ATCCGGCAAC CATTCTCGGT GCAGTCACAC CAGTACCAGA TACTTTGTCG 
GAATACGCCT TTGCCGGATT GCTACGTGGC ACCAAAACCG AAGTAGTGAA GTGTATTTCC 
AATGATCTCG AAGTGCCCGC CAGTGCGGAG ATTGTGCTGG AAGGGTATAT CGAACAAGGC 
GAAATGGCGC CAGAAGGACC GTATGGTGAC CACACTGGTT ACTATAACGA AGTCGATAGT 
TTCCCGGTAT TTACCGTGAC GCATATTACC CAGCGTGAAG ATGCGATTTA CCATTCCACC 
TATACCGGGC GTCCGCCAGA TGAACCCGCG GTACTGGGAG TGGCGTTGAA CGAAGTATTT 
GTTCCCATTC TGCAAAAGCA GTTCCCGGAA ATTGTCGATT TTTACCTGCC GCCGGAAGGC 
TGCTCTTATC GCCTGGCGGT AGTGACAATC AAAAAACAGT ACGCCGGACA CGCGAAGCGC 
GTCATGATGG GCGTCTGGTC GTTCTTACGC CAGTTTATGT ACACTAAATT TGTGATCGTT 
TGCGATGATG ACGTTAACGC ACGCGACTGG AACGATGTGA TTTGGGCGAT TACCACCCGT 
ATGGACCCAG CGCGGGATAC TGTTCTGGTA GAAAATACGC CTATTGATTA TCTGGATTTT 
GCCTCGCCTG TCTCCGGGCT GGGTTCAAAA ATGGGGCTGG ATGCCACGAA TAAATGGCCG 
GGGGAAACCC AGCGTGAATG GGGACGTCCC ATCAAAAAAG ATCCAGATGT TGTCGCACAT 
ATTGACGCCA TCTGGGATGA ACTGGCTATT TTTAACAACG GTAAAAGCGC CTGA

Protein sequence

MDAMKYNDLR DFLTLLEQQG ELKRITLPVD PHLEITEIAD RTLRAGGPAL LFENPKGYSM 
PVLCNLFGTP KRVAMGMGQE DVSALREVGK LLAFLKEPEP PKGFRDLFDK LPQFKQVLNM 
PTKRLRGAPC QQKIVSGDDV DLNRIPIMTC WPEDAAPLIT WGLTVTRGPH KERQNLGIYR 
QQLIGKNKLI MRWLSHRGGA LDYQEWCAAH PGERFPISVA LGADPATILG AVTPVPDTLS 
EYAFAGLLRG TKTEVVKCIS NDLEVPASAE IVLEGYIEQG EMAPEGPYGD HTGYYNEVDS 
FPVFTVTHIT QREDAIYHST YTGRPPDEPA VLGVALNEVF VPILQKQFPE IVDFYLPPEG 
CSYRLAVVTI KKQYAGHAKR VMMGVWSFLR QFMYTKFVIV CDDDVNARDW NDVIWAITTR 
MDPARDTVLV ENTPIDYLDF ASPVSGLGSK MGLDATNKWP GETQREWGRP IKKDPDVVAH 
IDAIWDELAI FNNGKSA