Gene Saro_2003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2003
Symbol
ID	3917323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2137479
End bp	2138885
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	63%
IMG OID	640444754
Product	S-adenosyl-L-homocysteine hydrolase
Protein accession	YP_497276
Protein GI	87200019
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0499] S-adenosylhomocysteine hydrolase
TIGRFAM ID	[TIGR00936] adenosylhomocysteinase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.012931
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCAGCG TGCTTGACGC CCAGAACGAT TATGTTGTCG CCGACATCGG CCTTGCCGAC 
TTCGGCCGCG CTGAAATCCG CATTGCGGAA ACGGAAATGC CGGGCCTGAT GGCCCTGCGC 
GAGGAGTTCG GCGCTTCGCA GCCGCTCAAG GGCGCGCGCA TCACCGGCTC GCTGCACATG 
ACCATCCAGA CCGCCGTGCT GATCGAGACC CTGGTCGCGC TGGGCGCCGA AGTGCGCTGG 
GCCACGTGCA ACATCTTCTC CACGCAGGAC CACGCCGCTG CCGCGATCGC CGCCGCCGGC 
ATTCCGGTCT TCGCGGTGAA GGGCGAAAGC CTTGCCGAAT ACTGGGACTA CGTCGGCTCG 
ATCTTCGACT GGGGCGACCA GACCGCCAAC ATGATCCTCG ACGATGGCGG CGACGCCACG 
ATGTTCGCCC TGTGGGGCGC GCGCGTCGAA GCCGGCGAGC CGCTGTTCGA ACCCTCGAAC 
GCCGAGGAAA TCGAATTCGT CCGCGCGCTC AAGGAATTCC TCAAGCGCAA GCCGGGCTAC 
CTCACCATGT CCGTCGCCCA CATCAAGGGC GTTTCGGAAG AGACCACCAC CGGCGTTCAC 
CGCCTCTACC AGATCGCCAA GGACGGCAAG CTGCCGTTCC CAGCGATCAA CGTGAACGAC 
AGCGTTACCA AGTCGAAGTT CGACAACCTC TATGGCTGCA AGGAATCACT GGTCGACGCG 
ATCCGCCGCG CCACTGACGT GATGCTGGCC GGCAAGGTCG CATGCGTTGC CGGCTTCGGT 
GACGTGGGCA AGGGTTCGGC CGCATCGCTG CGCCAGGGCG GCGCGCGCGT GATGGTGACC 
GAGATCGATC CGATCTGCGC GCTCCAGGCC GCGATGGAAG GCTATGAAGT CGTCACGATG 
GAAGAAGCCG TCCAGCGCTG CGACATCTTC GTCACCGCCA CCGGCAACGA AGACGTCATC 
ACCGCCGAGC ACATGAAGGC GATGAAGCCG ATGAGCATCG TCTGCAACAT CGGCCACTTC 
GACAGCGAGA TCCAGATCTC GGCGCTGAAC AACTACAAGT GGACCGAGAT CAAGCCGGGC 
ACTGACCTGG TCGAGTTCCC CGACGGCAAG CAGATCATCA TCCTTGCCAA GGGACGTCTG 
GTGAACCTGG GCTGCGCCAC CGGCCACCCG AGCTTCGTGA TGTCCTCGTC GTTCACCAAC 
CAGGTGCTGG CTCAGATCGA GCTGTTCACC AAGAACGCCG AATACAAGAA CGAAGTCTAC 
GTCCTGCCCA AGCACCTCGA CGAAAAGGTC GCGGCGCTGC ATCTCGAGAA GCTTGGCGTC 
AAGTTGACCA AGCTGAGCAA GAAGCAGGCG GACTATATCG GCGTTTCGCA GGAAGGTCCG 
TTCAAGCCGG ATCACTACCG CTACTGA

Protein sequence

MASVLDAQND YVVADIGLAD FGRAEIRIAE TEMPGLMALR EEFGASQPLK GARITGSLHM 
TIQTAVLIET LVALGAEVRW ATCNIFSTQD HAAAAIAAAG IPVFAVKGES LAEYWDYVGS 
IFDWGDQTAN MILDDGGDAT MFALWGARVE AGEPLFEPSN AEEIEFVRAL KEFLKRKPGY 
LTMSVAHIKG VSEETTTGVH RLYQIAKDGK LPFPAINVND SVTKSKFDNL YGCKESLVDA 
IRRATDVMLA GKVACVAGFG DVGKGSAASL RQGGARVMVT EIDPICALQA AMEGYEVVTM 
EEAVQRCDIF VTATGNEDVI TAEHMKAMKP MSIVCNIGHF DSEIQISALN NYKWTEIKPG 
TDLVEFPDGK QIIILAKGRL VNLGCATGHP SFVMSSSFTN QVLAQIELFT KNAEYKNEVY 
VLPKHLDEKV AALHLEKLGV KLTKLSKKQA DYIGVSQEGP FKPDHYRY