Gene Saro_0799 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0799
Symbol
ID	3915853
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	849016
End bp	850071
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	63%
IMG OID	640443530
Product	amidohydrolase 2
Protein accession	YP_496078
Protein GI	87198821
COG category	[R] General function prediction only
COG ID	[COG2159] Predicted metal-dependent hydrolase of the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACAAG ACCTTAAGAC CGGCGGCGAG CAGGGCTACC TGCGCATCGC CACCGAGGAA 
GCCTTCGCCA CGCGCGAGAT CATCGACGTC TACCTGCGCA TGATCCGCGA TGGCACTGCC 
GACAAGGGCA TGGTCTCGCT CTGGGGCTTC TACGCCCAGT CCCCCTCAGA GCGCGCCACC 
CAGATCCTCG AACGCCTGCT CGATCTTGGC GAGCGCCGCA TCGCCGACAT GGACGCGACC 
GGCATCGACA AGGCTATCCT CGCGCTGACC TCGCCCGGCG TCCAGCCGCT GCACGACCTT 
GACGAGGCCA GGACGCTCGC CACCCGCGCC AACGACACGC TTGCCGACGC GTGCCAAAAG 
TACCCAGACC GCTTCATCGG CATGGGCACC GTCGCCCCGC AGGACCCGGA ATGGTCCGCG 
CGCGAGATCC ATCGTGGTGC CAGGGAACTG GGCTTCAAGG GCATCCAGAT CAACAGCCAC 
ACGCAAGGGC GCTACCTCGA CGAGGAGTTC TTCGACCCGA TCTTCCGCGC CCTCGTTGAA 
GTCGACCAGC CGCTCTACAT CCACCCTGCC ACTTCGCCCG ATTCCATGAT CGACCCGATG 
CTCGAAGCGG GCCTCGACGG CGCCATCTTC GGCTTCGGCG TGGAGACGGG CATGCACCTG 
CTGCGCCTCA TCACCATCGG CATCTTCGAC AAGTATCCCA GCCTTCAGAT CATGGTCGGC 
CACATGGGCG AGGCGCTGCC CTACTGGCTC TACCGCCTGG ACTACATGCA CCAGGCCGGT 
GTCCGCTCGC AGCGCTACGA ACGCATGAAG CCCCTGAAGA AGACCATCGA GGGCTACCTC 
AAGTCCAACG TCCTCGTCAC CAATTCGGGC GTCGCGTGGG AACCTGCGAT CAAGTTCTGC 
CAGCAGGTCA TGGGCGAGGA CCGCGTTATG TACGCGATGG ACTACCCCTA CCAGTACGTT 
GCCGACGAGG TGCGCGCGAT GGACGCCATG GACATGAGTG CGCAAACGAA GAAGAAGTTC 
TTCCAGACCA ACGCGGAGAA GTGGTTCAAG CTTTGA

Protein sequence

MTQDLKTGGE QGYLRIATEE AFATREIIDV YLRMIRDGTA DKGMVSLWGF YAQSPSERAT 
QILERLLDLG ERRIADMDAT GIDKAILALT SPGVQPLHDL DEARTLATRA NDTLADACQK 
YPDRFIGMGT VAPQDPEWSA REIHRGAREL GFKGIQINSH TQGRYLDEEF FDPIFRALVE 
VDQPLYIHPA TSPDSMIDPM LEAGLDGAIF GFGVETGMHL LRLITIGIFD KYPSLQIMVG 
HMGEALPYWL YRLDYMHQAG VRSQRYERMK PLKKTIEGYL KSNVLVTNSG VAWEPAIKFC 
QQVMGEDRVM YAMDYPYQYV ADEVRAMDAM DMSAQTKKKF FQTNAEKWFK L