Gene Saro_3631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3631
Symbol
ID	5077779
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	257419
End bp	259161
Gene Length	1743 bp
Protein Length	580 aa
Translation table	11
GC content	65%
IMG OID	640481354
Product	amidohydrolase 3
Protein accession	YP_001166016
Protein GI	146275856
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3653] N-acyl-D-aspartate/D-glutamate deacylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGATA TTCTTATCAG GAACGGTACC GTCGTGGACG GGACCGGTGC TCCGGCGTTC 
AAGGCGGACG TGCGCGTGCG CGACGGCGTG ATCGCCGAGG TCGGCGAGAA CCTCAGCCCC 
AATGGCGAGC GCGTTTTCGA CGCCAGCGGC TGTCACGTCA CCCCCGGCTT CATCGAAAGC 
CACACCCACT ATGACGGCAC CATGTGGTGG CAGCCCGATC TCGATCCGCT GCCCGGCTAT 
GGCGCGACGA CGATGATCCT CGGCAACTGC GGTTTCTCGC CCGCGCCGCT GCACAAGTAC 
ATGCCCGCCC AGCGCGAGAT GATCGGCATC TTCTCGTTCT TCGAGGACAT CCCGGAAGGC 
CCGTTCATGC AGAACCTGCC GTGGGACTGG AACAAGTGGT CGGAATACCG CGCCTCGGTG 
GAACGCAACG TCAAGGTGCC GCTGAACTAC GCCGCCTATG TCGGCCACAT CGCCATCCGC 
CTTGCCGCGA TGGGCGTCGA GGCATGGGAG CGCGAGGCGA CCGCCGAGGA AATCGCCAAG 
ATGGCCGAAC TGCTCGACGA CGCGCTTGCC GCCGGCGCGC TCGGCATGTC CGACAACATG 
CACGACCATG ACGGACAGGA CCGCCCGGTT CCCACGCTCA AGGCCAACGA CGCCGAGTTC 
GAAGCCCTGT TCGACGTGAT GGAGCGCTAC CCCGGTTGCT GCTACCAGGT CATTGTCGAC 
ACCTTCATGC GCATGACCGG CCCGGCGAAC CTCGAACGCC TGTCGAAGCT TCTCGCCGGT 
CGCAAGATCA AGGTGCAGAT CGCGGGCGCC ATCCCCACGC TTGAATTCCA GAAGGGCATC 
CTGCCCGCGA TGCAGGAATC GGTGCGCAAG ATGCGCGAAG CCGGCGTCGA CGTGTGGCCC 
GGCTATGCCC ACGTCTCGCC GACCTCGACG CTCAGCCTCG TCAAGTCGCT GATCTTCGCG 
CAGTCGAACG ACTACGTCTG GCACGAAGTC GTGCTCGAGG ACGACCATGC CAAGAAGGCG 
GCGCTTCTCG CCGATCCGGA ATGGCGCGCC CGTGCCCGCG AAAGCTGGGA TACCCAGGCG 
TGGGATCATT CGCCGCTGAA GAACCCGCAG GAACTGTTCC TGCTCGACAG CGAGAACGGC 
GCGGGTCCGC TCAACATCAC GCTCAAGGAA TATGCCGACA GCCTCGGCCT GCACCGTTCG 
GACGCGATGG CGGACTGGAT CCTCAAGAAC GGCACCCGTT CGACCGTGCA TATGGCGCCC 
TTCCCCAAGG ACGAGGCACT GACGCTGGAA CTGATGAAGG ACCCGAAGAC CGTCGGCAAC 
ATCTCGGACG CCGGCGCGCA CCTTCAGATG CTTTGCGGTG GCGGCGAGAA CGCGCTGCTG 
CTGACCCAGT ACGTCCGCGA GGAAAAGAAG CTTTCGCTGG AACAGGCGAT CCACGTGATG 
ACCGGCAAGC TGGCCGGCCA CTTCAACCTC AATGACCGCG GCGTGATCGC GGTGGGCAAG 
CGCGCCGACA TCGCCGTGTT CAACATGGAC GAGATCCAGC GTCGCGAGAT GGAAAAGGCC 
TTCGACGTTC CCGACGGCCG CGGCGGCACC ACCTGGCGCT TTACCCGTCA GGCGATGCCC 
ACCCGCCTCA CCCTGGTGAA CGGCGTTCCG ACTTTCGAGA ACGGCGCCTT CACCGGTGCG 
ATGCCGGGCA AGTTCCTCTC CCCCGCGAAC GATGACGCGG CGCTGGCGGA GGCTGCGGAA 
TAA

Protein sequence

MSDILIRNGT VVDGTGAPAF KADVRVRDGV IAEVGENLSP NGERVFDASG CHVTPGFIES 
HTHYDGTMWW QPDLDPLPGY GATTMILGNC GFSPAPLHKY MPAQREMIGI FSFFEDIPEG 
PFMQNLPWDW NKWSEYRASV ERNVKVPLNY AAYVGHIAIR LAAMGVEAWE REATAEEIAK 
MAELLDDALA AGALGMSDNM HDHDGQDRPV PTLKANDAEF EALFDVMERY PGCCYQVIVD 
TFMRMTGPAN LERLSKLLAG RKIKVQIAGA IPTLEFQKGI LPAMQESVRK MREAGVDVWP 
GYAHVSPTST LSLVKSLIFA QSNDYVWHEV VLEDDHAKKA ALLADPEWRA RARESWDTQA 
WDHSPLKNPQ ELFLLDSENG AGPLNITLKE YADSLGLHRS DAMADWILKN GTRSTVHMAP 
FPKDEALTLE LMKDPKTVGN ISDAGAHLQM LCGGGENALL LTQYVREEKK LSLEQAIHVM 
TGKLAGHFNL NDRGVIAVGK RADIAVFNMD EIQRREMEKA FDVPDGRGGT TWRFTRQAMP 
TRLTLVNGVP TFENGAFTGA MPGKFLSPAN DDAALAEAAE