Gene Saro_2665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2665
Symbol
ID	3918439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	2903330
End bp	2904538
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	66%
IMG OID	640445442
Product	cystathionine gamma-synthase
Protein accession	YP_497935
Protein GI	87200678
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.6869
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGCA CGACTGGCCA GGACCGTTCG ATCACCCGCA AGTGGCGCCC CGCAACCCAG 
GCGATTCGCG GGGGCACGTG GCGCTCGGAG ATGGGCGAGA CATCCGAAGC GCTGTTCCTC 
ACCTCGGGCT TCACGTACGA CGACGCCGCC ACCGTTGCGG CGCGGTTCGC CGGCGAAGCG 
GAAGGCATGA CCTACTCCCG CCTGCAGAAT CCGACCGTGC AGATGCTGGA AGAACGCATC 
GCCCTGCTCG AAGGCGCGGA AGCTTGCCGC ACACAGGCAA CGGGCATGGC CGCGATGACC 
ACCGCCCTTC TCTGCCAGCT TTCCGCGGGC GACCACATCG TCGCCGCCAA GGCCGCGTTC 
GGCTCGTGCC GCTGGCTCGT CGACAACCTG CTGCCCCGTT TCGGCGTCCA GGGCACGACG 
ATCGATGCCT CGGACAATGC CGCCTGGGAA GCGGCGATCC GGCCCAACAC GAAGGTGTTC 
TTCTTCGAAA GCCCGGCAAA CCCGACGATG GACATCGTCG ATCTCGAGTT CGTCTGCGGC 
CTCGCCAAAA AGCATGGCAT CACCACCGTG GTCGACAATG CCTTCGCCAC GGCCGCCCTC 
CAGCGCCCGA TGGACTTCGG CGCCGACGTG GTTGCCTATT CGGCTACCAA GATGATGGAC 
GGCCAGGGCC GCGTCATGGC AGGCGCCGTC TGCGGCTCGG CCGACTGGAT CAACAACGTG 
CTGCTGCCGT TCCAGCGCAA CACCGGCCCG AACATCGCCG CATTCAATGC CTGGGTCGTG 
CTCAAGGGCC TCGAAACGCT CGACCTGCGC ATCCACCGGC AGAGCGAGAA CGCGCTGAAG 
GTCGCCAGCT TCGTCGAGAA GCGCGTGCCG CGCCTGCTCT ATCCGGGCCT GCCGAGCCAC 
CCCCAGCATG CCCTCGCGCA AAAGCAGATG AAGGCCGGCG GGACGATCTT CTCGTTCGAT 
CTCGACGGTG GCCGGGCCCA GGCGCACGCA CTGCTGGACG CGCTGCAACT GATCGACATC 
TCGAACAACA TCGGCGACTC GCGTTCGCTC ATGTGCCACC CGGCCTCGAC CACGCATCAC 
GGCGTCGGGC CCGAGACTCG CGCGGACATG GGCGTTGGCG AAGGCATGCT GCGCCTCAAC 
GTGGGCCTGG AAGACGCGGA CGACCTGATC GAGGATCTTG ACCAGGCACT GCGGAAAGCC 
GGGCTCTAA

Protein sequence

MKRTTGQDRS ITRKWRPATQ AIRGGTWRSE MGETSEALFL TSGFTYDDAA TVAARFAGEA 
EGMTYSRLQN PTVQMLEERI ALLEGAEACR TQATGMAAMT TALLCQLSAG DHIVAAKAAF 
GSCRWLVDNL LPRFGVQGTT IDASDNAAWE AAIRPNTKVF FFESPANPTM DIVDLEFVCG 
LAKKHGITTV VDNAFATAAL QRPMDFGADV VAYSATKMMD GQGRVMAGAV CGSADWINNV 
LLPFQRNTGP NIAAFNAWVV LKGLETLDLR IHRQSENALK VASFVEKRVP RLLYPGLPSH 
PQHALAQKQM KAGGTIFSFD LDGGRAQAHA LLDALQLIDI SNNIGDSRSL MCHPASTTHH 
GVGPETRADM GVGEGMLRLN VGLEDADDLI EDLDQALRKA GL