Gene Daci_2036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daci_2036
Symbol
ID	5747597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Delftia acidovorans SPH-1
Kingdom	Bacteria
Replicon accession	NC_010002
Strand	-
Start bp	2227992
End bp	2229308
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	70%
IMG OID	641297118
Product	fumarylacetoacetase
Protein accession	YP_001563061
Protein GI	160897479
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID	[TIGR01266] fumarylacetoacetase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.94384
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.503936
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTTGA ACGAAACCCA TGACGCAGGC TTGCGCAGCT GGGTGGCCTC GGCCAACACC 
GGCGCCAGCG ACTTTCCCAT CCAGAACCTG CCGTTTGCGG TGTTCCGCCG CGCAGGCAGC 
CAGGAGGCCT GGCGCGGCGG CGTGGCCATT GGCGACCAGG TGCTGGACCT GGCGCGCGCA 
AGCGCGATCA AGGCGCTGGG CGATGCCGTG CAGCCGCAGC TGGAAGCCGC TTCACAACAG 
CACCTGAACG GCTTCATGGC CATGGGACCT GCCGCCTGGT CGGCCCTGCG CCTGGCGCTG 
TCGCGCGCGC TGCGCGAAGG CGCTGCCGCA CAGGCGGCCC TGCAGGATTG CCTGGTGGCC 
CAGTCCGACG TGGAGTACAC GGTGCCGGCC CAGGTGGGCG ACTACACGGA CTTCTATACC 
TCGGTGCACC ACGCCACCAA CGTCGGCCAG CTGTTCCGCC CGGACAACCC GCTGATGGAG 
AACTACAAGT GGGTGCCGAT TGGCTACCAC GGCCGTGCGT CCAGCCTGCG TGTGTCGGGC 
GTGGACTTCC GCCGCCCCAT GGGCCAGCTG AAGGCGCCCG ACGCCACCGC ACCCGCGCTC 
AAGCCCTGCG CACGCCTGGA CTATGAGCTG GAGATGGGCA TCTACACCGG CGCCGGCAAC 
GCCTGGGGCG AGGCGATTTC CATGGACGAG GCAGAGAACC ACATCTTCGG CCTGTGCCTG 
CTCAACGACT GGTCGGCGCG CGACATCCAG GCCTGGGAAT ACCAGCCGCT GGGCCCCTTC 
CTGTCGAAGA ACTTCGCCAC CACGGTCTCG CCCTGGATCG TGACGCTGGA GGCGCTGGAG 
CCCTACCGCA CGGCCTTCAC GCGGCCCGCC ACAGATCCCC AGCCCCTGCC CTACCTGAGC 
TCGGCCGCCA ACTCCGAGCG CGGCGCGTTC GACGTGCAGT TGAGCGTGGC GCTGGAGACC 
GGCCGCATGC GCGCCGAAGG CCAAGCCGCC CAGCAAATCA CCCACACCAG CTACCGCCAC 
GCCTACTGGA CCATGGCACA GCTGGTGGCC CACCACAGCG TCAACGGCTG CGACCTGCAG 
CCCGGTGACC TGCTGGGCAC GGGCACGCTG TCCGGCCCCA CCTCCAGCGA GGCCGGTGCG 
CTGCTGGAGC TGACCGAAGG CGGCAAGAAG CCCGTGGCGC TGGCCAATGG CGAGAGCCGC 
ACCTTCCTGC AGGATGGCGA TGCCGTGATC CTGCGCGGCT GGTGCGAGAA GCCGGGCGCC 
GCGCGCATCG GCTTCGGCGA GTGCCGCGCC ACCGTGCTGC CCGCGCGCCA GGCCTGA

Protein sequence

MSLNETHDAG LRSWVASANT GASDFPIQNL PFAVFRRAGS QEAWRGGVAI GDQVLDLARA 
SAIKALGDAV QPQLEAASQQ HLNGFMAMGP AAWSALRLAL SRALREGAAA QAALQDCLVA 
QSDVEYTVPA QVGDYTDFYT SVHHATNVGQ LFRPDNPLME NYKWVPIGYH GRASSLRVSG 
VDFRRPMGQL KAPDATAPAL KPCARLDYEL EMGIYTGAGN AWGEAISMDE AENHIFGLCL 
LNDWSARDIQ AWEYQPLGPF LSKNFATTVS PWIVTLEALE PYRTAFTRPA TDPQPLPYLS 
SAANSERGAF DVQLSVALET GRMRAEGQAA QQITHTSYRH AYWTMAQLVA HHSVNGCDLQ 
PGDLLGTGTL SGPTSSEAGA LLELTEGGKK PVALANGESR TFLQDGDAVI LRGWCEKPGA 
ARIGFGECRA TVLPARQA