Gene EcolC_4167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4167
Symbol
ID	6067168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4605178
End bp	4606671
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	54%
IMG OID	641603595
Product	3-octaprenyl-4-hydroxybenzoate decarboxylase
Protein accession	YP_001727091
Protein GI	170022137
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000604115
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGACGCCA TGAAATATAA CGATTTACGC GACTTCTTGA CGCTGCTTGA ACAGCAGGGT 
GAGCTAAAAC GTATCACGCT CCCGGTGGAT CCGCATCTGG AAATCACTGA AATTGCTGAC 
CGCACTTTGC GTGCCGGTGG GCCTGCGCTG TTGTTCGAAA ACCCTAAAGG CTACTCAATG 
CCGGTGCTGT GCAACCTGTT CGGTACGCCA AAGCGCGTGG CGATGGGCAT GGGGCAGGAA 
GATGTTTCGG CGCTGCGTGA AGTTGGTAAA TTATTGGCGT TTCTGAAAGA GCCGGAGCCG 
CCAAAAGGTT TCCGCGACCT GTTTGATAAA CTGCCGCAGT TTAAGCAAGT ATTGAACATG 
CCGACAAAGC GACTGCGTGG TGCGCCCTGC CAACAAAAAA TCGTCTCTGG CGATGACGTC 
GATCTCAATC GCATTCCCAT TATGACCTGC TGGCCGGAAG ATGCCGCGCC GCTGATTACC 
TGGGGGCTGA CCGTAACGCG CGGCCCGCAT AAAGAGCGGC AGAATCTGGG CATTTATCGT 
CAGCAGCTGA TTGGTAAAAA CAAACTGATT ATGCGCTGGC TGTCGCATCG CGGCGGCGCG 
CTGGATTATC AGGAGTGGTG TGCGGCGCAT CCGGGCGAAC GTTTCCCGGT TTCTGTGGCG 
CTGGGTGCCG ATCCCGCCAC GATTCTCGGT GCAGTCACCC CCGTTCCGGA TACACTTTCA 
GAGTATGCGT TTGCCGGATT GCTGCGCGGT ACCAAGACCG AAGTGGTGAA GTGTATCTCC 
AATGACCTTG AAGTGCCCGC CAGTGCGGAG ATTGTGCTGG AAGGGTATAT CGAACAAGGT 
GAAACGGCGC CGGAAGGGCC GTATGGCGAC CACACCGGTT ACTATAACGA AGTCGATAGT 
TTCCCGGTAT TTACCGTGAC GCATATTACC CAGCGTGAAG ATGCGATTTA CCACTCCACC 
TATACTGGTC GTCCGCCGGA TGAACCCGCG GTGCTGGGTG TCGCACTGAA CGAAGTGTTT 
GTGCCGATTC TGCAAAAACA GTTCCCGGAA ATTGTCGATT TTTACCTGCC GCCGGAAGGC 
TGTTCTTATC GTCTGGCGGT AGTGACGATC AAAAAACAGT ACGCCGGACA CGCGAAGCGC 
GTCATGATGG GCGTCTGGTC GTTCTTACGC CAGTTTATGT ACACTAAATT TGTGATCGTT 
TGCGATGATG ACGTCAACGC ACGCGACTGG AACGATGTGA TTTGGGCGAT TACCACCCGT 
ATGGACCCGG CGCGGGATAC TGTTCTGGTA GAAAATACGC CTATTGATTA TCTGGATTTT 
GCCTCGCCTG TCTCCGGGCT GGGTTCAAAA ATGGGGCTGG ATGCCACGAA TAAATGGCCG 
GGGGAAACCC AGCGTGAATG GGGACGTCCC ATCAAAAAAG ATCCAGATGT TGTCGCGCAT 
ATTGACGCCA TCTGGGATGA ACTGGCTATT TTTAACAACG GTAAAAGCGC CTGA

Protein sequence

MDAMKYNDLR DFLTLLEQQG ELKRITLPVD PHLEITEIAD RTLRAGGPAL LFENPKGYSM 
PVLCNLFGTP KRVAMGMGQE DVSALREVGK LLAFLKEPEP PKGFRDLFDK LPQFKQVLNM 
PTKRLRGAPC QQKIVSGDDV DLNRIPIMTC WPEDAAPLIT WGLTVTRGPH KERQNLGIYR 
QQLIGKNKLI MRWLSHRGGA LDYQEWCAAH PGERFPVSVA LGADPATILG AVTPVPDTLS 
EYAFAGLLRG TKTEVVKCIS NDLEVPASAE IVLEGYIEQG ETAPEGPYGD HTGYYNEVDS 
FPVFTVTHIT QREDAIYHST YTGRPPDEPA VLGVALNEVF VPILQKQFPE IVDFYLPPEG 
CSYRLAVVTI KKQYAGHAKR VMMGVWSFLR QFMYTKFVIV CDDDVNARDW NDVIWAITTR 
MDPARDTVLV ENTPIDYLDF ASPVSGLGSK MGLDATNKWP GETQREWGRP IKKDPDVVAH 
IDAIWDELAI FNNGKSA