Gene Saro_2463 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2463
Symbol
ID	3916782
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2658391
End bp	2659686
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	64%
IMG OID	640445218
Product	fumarylacetoacetate hydrolase
Protein accession	YP_497733
Protein GI	87200476
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID	[TIGR01266] fumarylacetoacetase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCTGC CCTCTGTTGA CAAAACGCAT TCGGCTGACC TTGCAAGCTG GGTGCCTTCG 
GCGCTCGGCC ATGCCGACTT CCCTGTCCAG AACCTGCCGT TTGGGGTTTT CGCTCCGGCT 
GGGGAGCGGC CGCGGATCGG CACGGCCATC GGAGATTGCG TTCTGGACCT CTGTGCGGTC 
GGAGCGCTGT TGCCGCCAGA AGTATTGCCG TTGCTGGAAC TACCGGAACT CAACGCCCTT 
ATGGCCGCCC CCCGGGTCGT GAAGACTGCA TTGCGCCACA GGCTCTCGGA ACTGCTGTCG 
GATGACGCTC ATCGTCCCAT GGTGGAGCCG GCTCTGCATG ACGCGGCGTG CGTTGAAATG 
CTGCTTCCCA TGCGGATCGG CGATTACACC GATTTCTACG TCGGCATTCA TCACGCAACG 
AATATCGGCA AGCTGTTCCG GCCCGACAAC CCTCTTTTGC CCAACTACAA GCACGTGCCT 
ATCGGGTATC ATGGCCGTGC GTCCTCGATC AGGCAGAGCG GAGTGCCGGT GGCGCGACCG 
CGTGGCCAGC GCAGGGCGAA CGATGCGGAC GTTCCGGTGT TCGGGCCTTG CACGCGGCTG 
GACTACGAAC TCGAACTCGG CGTCTGGATC AGCGAGGGCA ACGCCTTGGG AACAACGATC 
CCGATTGCCG AGGCGGGCGA ACACATTGCC GGGCTGTGCC TGCTAAACGA CTGGTCTGCG 
CGCGATATCC AGGCGTGGGA ATACCAGCCG CTGGGGCCGT TCCTTGCCAA GAACTTCCAC 
ACGACGATCT CGCCCTGGGT CGTGACTGCC GAGGCACTGG CACCTTTCCG GATCGCGCAG 
CCGCCTCGTC CCCTTGGGGA CCCGGACCCG TTACCCTACC TGCGCGACGA GGCGGACCGG 
ATGGCAGGAG CCTTTGCAAT CGAACTTTCC GTATGGCTGA CGAGTGAACA GATGCGGGCA 
GGGCGGTATC CACCTTTGCG CCTCAGCAGG GGCCCAGCGA GCAACATGTA CTGGACCATT 
GCCCAGATGG TGACGCACCA CGCTTCGAAC GGATGCGGAC TAAACTCCGG CGACCTGCTT 
GGCACGGGCA CCATCTCCGG TACGGAGCAA GGCTCGAAGG GCAGTCTGAT CGAGATCAGC 
GAGGGCGGCA GGGTGCCGGT CGAACTGCCC ACCGGCGAAA CCCGCACCTT CCTCCTCGAT 
GGCGACGAGA TCAGCTTCTC GGCCACCGCG ACGGCACCAG GGCGGGCCCC GATCGGCTTT 
GGAGAATGCC GTGCCGTGAT CAGGCCCGCG CCATGA

Protein sequence

MNLPSVDKTH SADLASWVPS ALGHADFPVQ NLPFGVFAPA GERPRIGTAI GDCVLDLCAV 
GALLPPEVLP LLELPELNAL MAAPRVVKTA LRHRLSELLS DDAHRPMVEP ALHDAACVEM 
LLPMRIGDYT DFYVGIHHAT NIGKLFRPDN PLLPNYKHVP IGYHGRASSI RQSGVPVARP 
RGQRRANDAD VPVFGPCTRL DYELELGVWI SEGNALGTTI PIAEAGEHIA GLCLLNDWSA 
RDIQAWEYQP LGPFLAKNFH TTISPWVVTA EALAPFRIAQ PPRPLGDPDP LPYLRDEADR 
MAGAFAIELS VWLTSEQMRA GRYPPLRLSR GPASNMYWTI AQMVTHHASN GCGLNSGDLL 
GTGTISGTEQ GSKGSLIEIS EGGRVPVELP TGETRTFLLD GDEISFSATA TAPGRAPIGF 
GECRAVIRPA P