Gene Saro_0238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0238
Symbol
ID	3917587
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	246695
End bp	248005
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	67%
IMG OID	640442963
Product	peptidase M20
Protein accession	YP_495520
Protein GI	87198263
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.489939
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTTTGC CGATGGGTCT GGTTGCCGTT CTCGCGCTCG TCGGAACCGC CGCACATGCA 
GCGCCCAAGG GTGCCGAGGC ACGCATGATT GCCACCGTCG ATGCCGAGCA GGCGCGCACG 
TTGAGGTTCC TCGAAGTGAT GGTCAACCAG AACTCGGGCA GCCGCAACCT CGAAGGCGTG 
CGAAGGTTGC GCGACATTGT CGTGCCCGAA TTCACCGCGC TGGGCTTCAC GTCCCGCTGG 
ATCCCGATGG AACGGACCGG CCGGGCCGGG CACCTCGTCC TCACCCACAA GGGCCGCCAA 
GGCGCGAAGA AGCTTCTGCT GATCGGCCAC CTCGATACCG TGTTCGAACC TGACTCCCCC 
TTCCAGACCT ATGTCCTGAA CGGCGAAAAG GCGACCGGCC CTGGCGTCGG CGATGACAAG 
GGTGGCATCG CCGTGATCCT CGCTGCGGTC CGCGCCATGA ACGCTGCAGG AACGCTGAAG 
GGCGCCAGCA TCGAAGTCTT CCTTACCGGC GACGAAGAGG AGGCAGGCTC TCCCACCGAA 
GTCGCCCGCG CCGATCTCGT TGCCGCCGCC AGGGCCGCCG ACGTCGCGCT GGATTTCGAA 
GGCCTCTCCA GAGAGAACGG CCGCGACATG GGCTCGATCG CCCGCCGATC CTCGCAAAGC 
TGGTCTTTGA CGGTCGAGGC GAAGTCCGGC CACTCCAGCG GCGTCTGGGG CGCAAACGCG 
GGCGATGGCG CGATCTATGC CGCCGCGAAG ATCGTGAATG CCTTCCGCAC CGAACTGCCC 
GAACCCTGGC TTACCCTCAA CGTCGGCCTG ATCGCGGGCG GGGCGGAGGC AGAGGTCGCC 
GAGGACAACG CCCACGTCTC GGCACAGGGC AAGACCAATA TCATACCGGG CGAGGTCATC 
GCCCGCGGAG ACCTGCGCAC CCTCAGTCCC GAACAGAACC GCGCCGCCAT GCGCAAGATG 
GAGGAGATCG TCGGCAGGCC CTACCCCGGC GTCACCTCAG CCCGCATCGC ATTTAGCGAA 
GGCTACCCGC CCATGGCCCC GACCGAAGGC AACAAGGCGT TGCTGGCCCG CCTGAATCAG 
GTCAACGCCA CGCTTGGCTT GCCCGAAATG CAGCCGCTCG ATCCGATGAA GCGCGGGGCC 
GGGGACATCA GCTTCGTCGC GGAATACATC GACGGCCTCG TCGGCCTCGG CCCGCACTCC 
ACCGGCGATC ACGCGCCGGG CGAAACGGTC GACGTCCCCA GCATCTGGAC CCAGGCCAAG 
CGCGCCGCCC TGCTGATGAC CCGGCTCTCG GCGGAGAAGT CCGCGCGGTG A

Protein sequence

MRLPMGLVAV LALVGTAAHA APKGAEARMI ATVDAEQART LRFLEVMVNQ NSGSRNLEGV 
RRLRDIVVPE FTALGFTSRW IPMERTGRAG HLVLTHKGRQ GAKKLLLIGH LDTVFEPDSP 
FQTYVLNGEK ATGPGVGDDK GGIAVILAAV RAMNAAGTLK GASIEVFLTG DEEEAGSPTE 
VARADLVAAA RAADVALDFE GLSRENGRDM GSIARRSSQS WSLTVEAKSG HSSGVWGANA 
GDGAIYAAAK IVNAFRTELP EPWLTLNVGL IAGGAEAEVA EDNAHVSAQG KTNIIPGEVI 
ARGDLRTLSP EQNRAAMRKM EEIVGRPYPG VTSARIAFSE GYPPMAPTEG NKALLARLNQ 
VNATLGLPEM QPLDPMKRGA GDISFVAEYI DGLVGLGPHS TGDHAPGETV DVPSIWTQAK 
RAALLMTRLS AEKSAR