Gene Saro_3422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3422
Symbol
ID	5077571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	22501
End bp	23445
Gene Length	945 bp
Protein Length	314 aa
Translation table	11
GC content	66%
IMG OID	640481146
Product	fumarylacetoacetate (FAA) hydrolase
Protein accession	YP_001165808
Protein GI	146275648
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.247714
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCTGG CAACCTTGCG CGATGGAACG AAGGACGGAC GGCTTGTCGT CGTCTCGCCC 
GATGGCACGG CATGTGCCCC CGCGCCCGTC ACGACGTTGC AGCAGGCGCT CGAGGATTGG 
GTTGAGGTCG AACCGGCCTT GCGCGCCATC GCGGCGTTTC CCGATGTCCT CGATCCAGCG 
CAGGTCATGG CCCCGCTGCC GCGCGCCTGG CAGTGGCTCG ATGGCTCCGC GTTCCAGAGC 
CATGGCGACC TGATGGACGC GGTGCTTGGC ATCACCAAGC CGAGGACCGA CGTGCCGCTG 
ATGTACCAGG GCACATCCGA CAGGTTCTAT GGTCCGACCG ACGACGTAAA GTTCCCCGAC 
GAGGCGCTGG GGATCGATTT CGAGGGCGAG TTCGGCGTGA TCGTCGATGC GGTGCCGATG 
GGCACGAGCG CGGCGGACGC AATGGGCCAC ATCCGCCTTG TCGTCCAGAT CAACGACTGG 
TCGTTGCGCA CCCTTGCCGG GCCGGAAATG AAGACCGGCT TCGGATGGGT CCAGGCCAAG 
CCCCCGTGCG GCATGGCGCC CTTCGCCGTG ACGCCCGAGG AACTGGGCGA TAGCTGGCAC 
AACGGGCGCG TGTGCCTCGA TCTCGAGGTC GACTGGAACG GCCGGCGCTT TGGCGCCGCC 
AATGGCGAGC CGATGGGTCA TGGCTTCCAC GAACTCGTCG CCCACGCCGC CCGCACGCGC 
GATCTCGTCG CTGGCACGGT GATCGGATCG GGCACCGTAT CCAACGCCAA TTTCCGCGAG 
ATCGGATCGT CGTGCATCGC CGAACGGCGC GGGATCGAAG TCATCGATCT TGGCGAACCG 
AAGACGGAAT TCATGCGGTT CGGCGATACC GTTCGCATGG AAGCGGTCGA CGCAAGCGGA 
CGCGCCCCGT TCGGCGCCAT CGAGCAGAAG GTAGTGAAGG CATGA

Protein sequence

MRLATLRDGT KDGRLVVVSP DGTACAPAPV TTLQQALEDW VEVEPALRAI AAFPDVLDPA 
QVMAPLPRAW QWLDGSAFQS HGDLMDAVLG ITKPRTDVPL MYQGTSDRFY GPTDDVKFPD 
EALGIDFEGE FGVIVDAVPM GTSAADAMGH IRLVVQINDW SLRTLAGPEM KTGFGWVQAK 
PPCGMAPFAV TPEELGDSWH NGRVCLDLEV DWNGRRFGAA NGEPMGHGFH ELVAHAARTR 
DLVAGTVIGS GTVSNANFRE IGSSCIAERR GIEVIDLGEP KTEFMRFGDT VRMEAVDASG 
RAPFGAIEQK VVKA