Gene ECH74115_3989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3989
Symbol	kpdC
ID	6967454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3688833
End bp	3690260
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	58%
IMG OID	643387758
Product	4-hydroxybenzoate decarboxylase, subunit C
Protein accession	YP_002272201
Protein GI	209395965
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	70
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCATTTG ATGATTTACG CAGCTTTTTA CAGGCGCTTG ATGACCACGG CCAGTTACTG 
AAAATCAGCG AAGAGGTGAA CGCGGAACCG GATCTGGCTG CCGCTGCCAA CGCCACCGGG 
CGTATCGGCG ATGGTGCACC GGCGCTGTGG TTTGATAATA TTCGCGGTTT TACCGATGCC 
CGCGTGGCGA TGAATACCAT CGGTTCCTGG CAGAACCACG CGATTTCCTT GGGCCTGCCG 
CCAAACACCC CGGTTAAAAA ACAGATTGAT GAGTTTATCC GCCGCTGGGA TAACTTCCCG 
ATCGCCCCGG AGCGCCGCGC CAATCCAGCC TGGGCGCAGA ACACCGTCGA TGGTGACGAG 
ATTAATCTGT TCGATATCCT GCCGCTGTTT CGTTTAAACG ACGGTGATGG CGGTTTCTAT 
CTCGACAAAG CGTGCGTGGT TTCCCGCGAT CCGCTCGACC CGGATAACTT CGGCAAGCAG 
AACGTCGGTA TCTACCGCAT GGAAGTGAAG GGCAAGCGTA AGCTCGGCCT GCAACCGGTG 
CCGATGCACG ATATCGCCCT GCATCTGCAT AAAGCGGAAG AGCGCGGTGA AGATCTGCCG 
ATTGCCATCA CCCTGGGTAA CGATCCGATC ATCACCCTTA TGGGCGCCAC GCCGCTGAAA 
TACGATCAGT CTGAGTATGA AATGGCAGGC GCGCTGCGCG AAAGCCCGTA CCCGATCGCC 
ACCGCGCCAT TGACTGGTTT TGATGTGCCG TGGGGTTCAG AAGTGATCCT CGAAGGGGTT 
ATCGAAAGCC GCAAACGCGA AATCGAAGGG CCGTTCGGTG AGTTTACCGG GCACTACTCC 
GGCGGGCGTA ACATGACCGT GGTGCGTATC GATAAAGTCT CTTACCGCAC CAGGCCGATT 
TTCGAATCGC TGTACCTCGG CATGCCGTGG ACCGAAATCG ACTACCTGAT GGGGCCAGCC 
ACCTGTGTGC CGCTGTATCA ACAACTGAAA GCCGAGTTCC CGGAAGTGCA GGCGGTAAAC 
GCCATGTACA CCCACGGCCT GCTGGCGATT ATCTCCACCA AAAAACGCTA CGGCGGCTTT 
GCCCGCGCGG TGGGCCTGCG TGCGATGACC ACGCCGCACG GTCTGGGCTA CGTAAAGATG 
GTGATTATGG TCGATGAAGA CGTTGACCCG TTCAACCTGC CGCAGGTGAT GTGGGCGCTC 
TCCTCGAAAG TAAATCCGGC AGGGGATTTG GTGCAGTTGC CGAATATGTC CGTGCTGGAA 
CTCGACCCTG GCTCAAGCCC GGCGGGGATC ACCGACAAGC TGATTATCGA CGCCACCACG 
CCTGTCGCCC CGGACAACCG TGGTCACTAC AGCCAGCCGG TGGTGGATTT GCCGGAAACC 
AAAGCCTGGG CTGAAAAACT GACCGCTATG CTGGCCGCAC GTAAATAA

Protein sequence

MAFDDLRSFL QALDDHGQLL KISEEVNAEP DLAAAANATG RIGDGAPALW FDNIRGFTDA 
RVAMNTIGSW QNHAISLGLP PNTPVKKQID EFIRRWDNFP IAPERRANPA WAQNTVDGDE 
INLFDILPLF RLNDGDGGFY LDKACVVSRD PLDPDNFGKQ NVGIYRMEVK GKRKLGLQPV 
PMHDIALHLH KAEERGEDLP IAITLGNDPI ITLMGATPLK YDQSEYEMAG ALRESPYPIA 
TAPLTGFDVP WGSEVILEGV IESRKREIEG PFGEFTGHYS GGRNMTVVRI DKVSYRTRPI 
FESLYLGMPW TEIDYLMGPA TCVPLYQQLK AEFPEVQAVN AMYTHGLLAI ISTKKRYGGF 
ARAVGLRAMT TPHGLGYVKM VIMVDEDVDP FNLPQVMWAL SSKVNPAGDL VQLPNMSVLE 
LDPGSSPAGI TDKLIIDATT PVAPDNRGHY SQPVVDLPET KAWAEKLTAM LAARK