Gene Acid345_2007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_2007
Symbol
ID	4070913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	2406299
End bp	2407588
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	60%
IMG OID	637984021
Product	fumarylacetoacetate hydrolase
Protein accession	YP_591082
Protein GI	94969034
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID	[TIGR01266] fumarylacetoacetase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.79989
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGAGA CACATGATCC AAAGATCAAG TCGTGGGTTG CTTCGGCCAA TGCGCCGGAC 
TGCGACTTCC CGCTGCAGAA CTTGCCGTTC GGAGTCTTCC GTCGCAAGAA TGACGAAGGT 
GGCGGCATCG GCGTCGCGAT TGGCGATCAG GTGTTCGATG TCGGCGCCTG GGTGCGCGAC 
CAAGGGAAGA GCTCTGCTGA ATTTAAACTT CTGACTGAAA AGCGCCTGAA CCGATTCCTA 
GCTGCCGGCC CGCAGATATG GAGCGCGGCA CGCATGGCAC TGTTTAACCT GCTGCGCGAA 
GATTCTCCGC AACGCGAGCA GGTAGCGCGC TATCTCGATG CAACTGCGAA CGTCGAGATG 
GAGATGCCGA TCGATATCGG CGATTACACC GATTTCTACG CCTCCGTCTT CCACGCGACG 
AATGTGGGGA GCATGTTCCG GCCGGACAAT CCTCTGCTGC CAAATTACAA GTGGGTGCCG 
ATCGGCTATC ACGGGCGAGC TTCTTCTGTC GTCGCCAGCG GCGCGGCAGT GAAGCGGCCG 
AGCGGCCAGC GCAAGCCACC GACGGCTGAC ATGCCGACAT TTGGTCCGTG CGCACAGCTC 
GACTACGAAC TCGAAGTGGG CGCAGTGATC GGGCCGGGGA ATGCCCTTGG AGAGACGGTA 
CCGTTGCGCG ACGCAGAGAA GCACATCTTC GGCTTGTGCT TGCTGAACGA TTGGTCGGCG 
CGCGATATAC AAGCGTGGGA GTATCAACCC CTGGGGCCGT TTCTGGCCAA GAACTTCGTG 
ACCACGATTT CTCCGTGGCT CGTGACGCTG GAAGCGCTCG AGCCCTATCG TAGGAGCGCG 
TACAAGCGTC CGGAGGGCGA TCCACAGCCC TTGCCGTATC TCAGTGACGA AAACGACCAG 
CAGCGCGGCG CCTTCGACGT CTCGCTCGAT GCTTATCTTT CGACGCGCAA GATGCGTGAT 
GAGAAAATCG CGCCAATCAG CCTGAGTCAC GGATCTTTAC GCGATATGTA TTGGACCTTC 
GGGCAGATGC TCGCGCACCA TGCCTCGAAC GGATGCAATC TCCAACCTGG CGACTTGATC 
GGCAGCGGCA CGGTTTCTGG ACAGTCGAAA CACTCGCGGG GATGCCTGCT CGAGCTGTCT 
TGGCGCGGCA CCGAGCCCAT CTCACTACCG AGCGGCGAAA CTCGCAAGTT TCTCGAAGAT 
GGCGACGAGG TAATCTTCCG CGGCTACGCG GAGCGCGAAG GTCAAGCACG GATTGGCTTC 
GGCGAGTGCC GGGGCATCGT CGTCGGATGA

Protein sequence

MNETHDPKIK SWVASANAPD CDFPLQNLPF GVFRRKNDEG GGIGVAIGDQ VFDVGAWVRD 
QGKSSAEFKL LTEKRLNRFL AAGPQIWSAA RMALFNLLRE DSPQREQVAR YLDATANVEM 
EMPIDIGDYT DFYASVFHAT NVGSMFRPDN PLLPNYKWVP IGYHGRASSV VASGAAVKRP 
SGQRKPPTAD MPTFGPCAQL DYELEVGAVI GPGNALGETV PLRDAEKHIF GLCLLNDWSA 
RDIQAWEYQP LGPFLAKNFV TTISPWLVTL EALEPYRRSA YKRPEGDPQP LPYLSDENDQ 
QRGAFDVSLD AYLSTRKMRD EKIAPISLSH GSLRDMYWTF GQMLAHHASN GCNLQPGDLI 
GSGTVSGQSK HSRGCLLELS WRGTEPISLP SGETRKFLED GDEVIFRGYA EREGQARIGF 
GECRGIVVG