Gene Saro_1302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1302
Symbol
ID	3917934
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1347061
End bp	1348275
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	68%
IMG OID	640444039
Product	tryptophan synthase subunit beta
Protein accession	YP_496580
Protein GI	87199323
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.212962
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCCC AGACTCCCAA CAGCTTCCGC AACCTGCCCG ACGAGCGCGG CCACTTCGGC 
CAGTTCGGCG GTCGCTACGT CGCCGAAACG CTGATGCCGC TGATCCTCGA TCTCGAACGC 
GAGTACAACG CCGCGAAAGC CGACCCGGCG TTCAAGGCCG AGTTCGACGA CCTCCTGGAA 
CACTATGTCG GCCGCCCGAG CCCGCTCTAC TTCGCGCCGC GGCTGACCGA GGAGCTGGGC 
GGAGCACAGG TCTGGTTCAA GCGCGACGAG CTGAACCACA CCGGCGCGCA CAAGATCAAC 
AACTGCATCG GCCAGATCCT GCTCGCCATG CGCATGGGCA AGACCAGGAT CATCGCCGAG 
ACCGGCGCGG GCCAGCACGG CGTGGCCACC GCCACCGTCT GCGCGCGCTT CGGCCTGCCC 
TGCGTGATCT TCATGGGTGC GACCGACGTT GCCCGCCAGG CGCCCAACGT GTTCCGCATG 
AAGCTGCTCG GCGCCGAAGT CGTGCCGGTC ACGGCGGGCG CGGGCACGCT GAAGGACGCG 
ATGAACGAGG CGCTGCGCGA CTGGGTCGCC AACGTCCACA ACACTTTCTA CATCATCGGC 
ACCGCCGCGG GCCCGCACCC CTATCCGGAA CTGGTCCGCG ACTTCCAGAG CGTGATCGGC 
AAGGAAGCGC GCGCGCAGAT GCTCTCCCGC ACCGGCCGCC TGCCCGACCT TCTGGTCGCG 
GCGATCGGCG GCGGCTCCAA CGCCATCGGC CTGTTCCACC CCTTCCTCGA CGACCCGAGC 
GTCAGGATGC TGGGCGTGGA GGCCGCCGGC CACGGCCTCG ACAAGGAGCA CGCCGCCAGC 
CTCGCGGGCG GACGCCCCGG CATCCTCCAC GGCAACAAGA CCTACCTGCT GCAGGACGAG 
GACGGCCAGA TCACCGAAGG TCACTCGATC TCGGCTGGCC TCGACTATCC CGGCATCGGC 
CCGGAACACG CCTGGCTGAA GGAAATCGGC CGCGTCGACT ACACCTCGGT CACCGATACC 
GAGGCGCTCG ACGCCTTCCA GCTCCTGTGC CGCACCGAAG GCATCATCCC CGCGCTCGAA 
CCGGCCCATG CCATCGCGGC GGTCAAGAAG GTCGCCCCGA CCATGGGCAA GGACGAAATC 
ATCCTCGCCA ACCTATGCGG CCGTGGCGAC AAGGACATCT TCTCGGTGGC CGAACATCTG 
GGGGTGTCGC TCTGA

Protein sequence

MTAQTPNSFR NLPDERGHFG QFGGRYVAET LMPLILDLER EYNAAKADPA FKAEFDDLLE 
HYVGRPSPLY FAPRLTEELG GAQVWFKRDE LNHTGAHKIN NCIGQILLAM RMGKTRIIAE 
TGAGQHGVAT ATVCARFGLP CVIFMGATDV ARQAPNVFRM KLLGAEVVPV TAGAGTLKDA 
MNEALRDWVA NVHNTFYIIG TAAGPHPYPE LVRDFQSVIG KEARAQMLSR TGRLPDLLVA 
AIGGGSNAIG LFHPFLDDPS VRMLGVEAAG HGLDKEHAAS LAGGRPGILH GNKTYLLQDE 
DGQITEGHSI SAGLDYPGIG PEHAWLKEIG RVDYTSVTDT EALDAFQLLC RTEGIIPALE 
PAHAIAAVKK VAPTMGKDEI ILANLCGRGD KDIFSVAEHL GVSL