Gene Saro_3646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3646
Symbol
ID	5077794
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	274227
End bp	275996
Gene Length	1770 bp
Protein Length	589 aa
Translation table	11
GC content	69%
IMG OID	640481369
Product	amidohydrolase 3
Protein accession	YP_001166031
Protein GI	146275871
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG3653] N-acyl-D-aspartate/D-glutamate deacylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.668872
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGCCA GCAAGCCCGA GGCGCCCGTC GGATTCGACG CCGACCTGCT GATCCGCGAC 
GGAACCGTGA TCGACGGATC GGGCGCAGCG CCATTTACCG GCGACGTGGC CATCAAGGAC 
GACCGGATCG TCCATGTCGG CCCCGCGTTC CGGGGCAGCG CAGCGCGCAC CATCGACGCA 
CAGGGCCTGA TCGTCACCCC CGGCTTCGTC GACATCCACA CCCACTATGA CGGGCAAGCC 
GCATGGTCGG ACACGCTCTC GCCAAGCAGT TCGCACGGGG TGACGACGGC AGTGCTTGGC 
AATTGCGGCG TGGGCTTCGC GCCGTGCAAG CCCGAGGATC GCGAGGCGCT GATCCGGCTG 
ATGGAAGGCG TCGAGGACAT TCCCGGCGTG GTCATGGCCG AAGGCCTGCC GTGGGACTGG 
GACAGCTTCC CGTCCTATCT CGACGCGCTT GCCGCACGGC GGCGTGACAT CGACGTGGCC 
TGCCTGCTGC CGCACAGCCC CTTGCGCGTA TGGGTCATGG GCGAAAGGGC CATTGCGCGC 
GAGGAGGCGA CCGAAGCCGA TCTTGCCGAA ATGCGCCGCC TTGCACGCGA AGCGCTGGAC 
GCGGGCGCCG TGGGGTTCGC GACCTCGCGG CTCAACATCC ATCGCACCAA GAGCGGCGAC 
CTGATCCCGA CCTTCGGCGC CGACACGCGC GAGCTTGTCG CCATCGCAGG CGCGTTGGCC 
GATGCGGAGA CGGGCGTGTT CCAGGCGGTG CTGGACGCGC CGTTCACCGC GTGGGACGAG 
GAAATGGGAC GATTGCTGGC GGTTGCCGAG GCCGCGGGCC GTCCGGCAAC CTTCACCCTG 
GGCGTCGCCA ACAGCGGGGC CGCCAACTGG AAGCCAGCCA CCGACCTTGT CGATGCAGGC 
CGGGCGCGCG GGCTGGAGAT CTGGCCTCAG GTCCTGCCCC GGCCCATCGG CATGATTTCA 
GGCTGGGCGC TGTCGACGCA CCCGTTCTGC CTGTGCCCGT CCTACCAGGC CATTGCCGGC 
CTCCCGCTGG ACGAGCAATT GCCGACATTG CGCGACCCCA CCTTCCGGGC GAAGCTGATC 
TCCGAAGTGC CGCAGCCGGG CCATCCGCTG GCCATGCTGA CGCGCATCTG GGACTGGATG 
TTCCCGTTCA ACGACCCGCC CCAGTACGAA CCGGCGCGCG AAACAAGCAT CGCCGCACAA 
GCCAGGGCAC AGGGCCGTTC GTGCGAAGAG GTGGCCTACG ACCTGCTGAT GGAGCGGGAG 
GGCAACGGCA TGATCCTGAA CACGCTGGGC AACTTCCTTG AAGGCAAGCT CGATGCGCTG 
CTCGAACTGA TGCGGCGCGA GGATACCGTG ATCGGACTGG GGGATGGCGG CGCGCACTAT 
GCGGCGATCT GCGACGCCAG TTACCCGACC TTCATGCTGA CCTACTGGGT GCGCGACCGG 
GCAGGCGAAA GGCTGACGCT GCCCGAGGCG GTCGAACGAC TGGCGGCGCG ACCGGCGCGG 
GTCATGGGCC TGGAGGATCG CGGACTGCTT AAGCCCGGAT ACAAGGCAGA CCTCAACGTG 
ATCGACCTGG ACCGGCTGAC GCTTCACGCG CCGGTGGTGA AGCACGACCT GCCGGGCGGC 
GGGCGCAGGC TGGACCAGAC CGCGACGGGA TATGTCGCCA CGGTCGTCAA CGGACGGGTG 
ATCCGCGAGC ACGACCAGCC GACCGACGAG CGGCCGGGCC GGGTGGTGCG CGGAGCCCAG 
CACGCGCAGC GCGCGGCGGT GCCGGCCTGA

Protein sequence

MTASKPEAPV GFDADLLIRD GTVIDGSGAA PFTGDVAIKD DRIVHVGPAF RGSAARTIDA 
QGLIVTPGFV DIHTHYDGQA AWSDTLSPSS SHGVTTAVLG NCGVGFAPCK PEDREALIRL 
MEGVEDIPGV VMAEGLPWDW DSFPSYLDAL AARRRDIDVA CLLPHSPLRV WVMGERAIAR 
EEATEADLAE MRRLAREALD AGAVGFATSR LNIHRTKSGD LIPTFGADTR ELVAIAGALA 
DAETGVFQAV LDAPFTAWDE EMGRLLAVAE AAGRPATFTL GVANSGAANW KPATDLVDAG 
RARGLEIWPQ VLPRPIGMIS GWALSTHPFC LCPSYQAIAG LPLDEQLPTL RDPTFRAKLI 
SEVPQPGHPL AMLTRIWDWM FPFNDPPQYE PARETSIAAQ ARAQGRSCEE VAYDLLMERE 
GNGMILNTLG NFLEGKLDAL LELMRREDTV IGLGDGGAHY AAICDASYPT FMLTYWVRDR 
AGERLTLPEA VERLAARPAR VMGLEDRGLL KPGYKADLNV IDLDRLTLHA PVVKHDLPGG 
GRRLDQTATG YVATVVNGRV IREHDQPTDE RPGRVVRGAQ HAQRAAVPA