Gene Saro_1061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1061
Symbol
ID	3916357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1104677
End bp	1105735
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	66%
IMG OID	640443796
Product	pyridoxal-5'-phosphate-dependent enzyme, beta subunit
Protein accession	YP_496340
Protein GI	87199083
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.173696
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGGAAG AATCCAGGGC CTGGGCCGAC GAGGCGGTGC GGCGGATCGA GGCGGATTTC 
AACCGCTCAG CCGACACGCA TCTCATCCGC GTAGAACTTC CACGCTTTCC GGGCATCACG 
CTCTATCTCA AGGACGAGAG CGTCCATCCG ACCGGCAGTC TCAAGCACCG GCTCGCCCGC 
TCGCTGATCC TCTATGGCCT GTGCAACAAT CGCATCGGGC CCGACACGCT GTTGGTCGAT 
GCGACGAGTG GCTCCACGGC GGTGTCGGAA GCCTATTTCG CCCGGCTGAT CGGCCTGCGC 
TTCGTGGCGG TTATTCCGCG CAGCACGTCA CCCGCGAAGA TCGATGCGAT CCGCTTTCAC 
GGCGGGGAGG TGCACATGGT CGATACCGCG GCGCAGATGT ACGCGGAGGC GGCGCGCCTT 
GCGGACGACG CGGGCGGTTT GTTCCTTGAC CAGTTCACGT ATGCCGAGCG CGCGACCGAC 
TGGCGCGGCA ACAACAACAT CGCGCAATCC ATCTTCCAGC AGATGTCGCG CGAGGATCAT 
CCGGTGCCGT CGTGGATCGT GTGCGGGGCT GGGACCGGTG GTACTTCCGC CACGCTCGGG 
CGCTTCATCC GTTACGGCCG CCATGCGACA CGGCTTTGCG TTGCAGATCC TGAAGGCTCG 
GTGTTCCACC TCCACCATGC CGACCGAAGC GTCACAGAGC CGTCCCGGGG AGTGCGCTGC 
ATGATCGAGG GAATCGGCCG GCCGCGCGTG GAGCCTTCTT TCCTGCCCGA CGTGATCGAC 
CGCATGATCG CGGTGCCCGA TGCGGCGTCG ATCGGTGCGA TGCGGGCCAT CGCAGCGCGG 
ATCGGACGTC CGGTCGGGGG TTCGACAGGA ACCAATGTCC ACGCTTGCCT CGAGATCGCG 
CAGGAAATGG CAGCTTCCGG CGAGACCGGG TCGATCGTCA CGATCCTGTG CGATTCCGGG 
CTGCGCTATG CGGGGACCTA CTACGACGAT GCCTGGCTCG ACGGGCAGGG CATCGACTGG 
CGGGCCGACG AGGTGCGCGT CGCGGCGTTG CTTTCCTGA

Protein sequence

MREESRAWAD EAVRRIEADF NRSADTHLIR VELPRFPGIT LYLKDESVHP TGSLKHRLAR 
SLILYGLCNN RIGPDTLLVD ATSGSTAVSE AYFARLIGLR FVAVIPRSTS PAKIDAIRFH 
GGEVHMVDTA AQMYAEAARL ADDAGGLFLD QFTYAERATD WRGNNNIAQS IFQQMSREDH 
PVPSWIVCGA GTGGTSATLG RFIRYGRHAT RLCVADPEGS VFHLHHADRS VTEPSRGVRC 
MIEGIGRPRV EPSFLPDVID RMIAVPDAAS IGAMRAIAAR IGRPVGGSTG TNVHACLEIA 
QEMAASGETG SIVTILCDSG LRYAGTYYDD AWLDGQGIDW RADEVRVAAL LS