Gene Saro_0921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0921
Symbol
ID	3918007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	973079
End bp	974500
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	67%
IMG OID	640443655
Product	threonine synthase
Protein accession	YP_496200
Protein GI	87198943
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0498] Threonine synthase
TIGRFAM ID	[TIGR00260] threonine synthase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.400205
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTACG TCAGCACCCG GGGGCAGGCA CCCTCGCTCG ATTTCCAGGG CGTCACGCTC 
GCAGGCCTCG CTTCGGATGG CGGGCTCTAC GTGCCCGAGA GCTGGCCGCA GTTCTCGCAC 
GACGAGATCG CCGCGATGGC CGGGCTGCCC TATGCCAGGC TGGCGCAGAA GATCATGCAG 
CCCTACGTCG GCGATTGCCT GACGCCGGAG CGCCTGCTGG AGCTGTGCGA ACAAGCCTAT 
GGCCGTTTCG CGCACGCTGC CGTGACGCCG CTCAAGCAGC TCGACGAGAC GCAGTGGGTG 
CTCGAACTGT TCCATGGGCC GACGCTGGCT TTCAAGGACG TCGCGCTCCA GTTGCTTGGC 
CTGCTGTTCG AGGAATTCCT TGCGCGTCCG AGAGAGGATG GGGGCGACGA GCACATCACC 
ATCGTCGGGG CGACTTCGGG TGACACCGGG TCTGCCGCCA TCGATGCGGT GGCGGGTCGC 
GCCAAGGTCG ATATCTTCAT GCTCCACCCG CATGGCCGGG TATCCGATGT GCAGCGCCGC 
CAGATGACCA CGGTCATCGC GCCCAACGTC CACAACATCG CCATCGACGG CAGCTTCGAC 
GATGCCCAGG CGATGGTGAA GCGCATGTTC AACGACAGCG CGATGACCGG CCGCTTCGGC 
ATCGCCGCCG TCAACTCGAT CAACTGGGCG CGCCTGATGG CGCAGGTGGT CTACTACTTC 
TACGCCGCGC TCCAGCTTGG CGCGCCGCAC CGCAAGGTTG CCTTCTCGGT GCCGACCGGC 
AACTTCGGGG ATGTCTTCGC AGGCTACGTC GCGGCGAAGA TGGGCCTTCC GATCGAGCGG 
CTGATCGTGG CCACCAACGT CAACGACATC CTCCACCGCG CGCTTTCGGC AGGCGATTAT 
TCGGCCAGCA CCGTAACGCC GACCGCCGCG CCATCGATGG ACATCCAGGT TTCCTCGAAC 
TTCGAGCGCC TGCTGTTCGA CGGCTGCGGT CGCGACGCAT CGGCGCTTGC CGCGCAGATG 
AAGCATTTCG AAGTGACCAA GGCGATGCAG CTCACGAATG CGCAGCGCGA ATCGGCGGCC 
GCGCTGTTCA GCTCCGCTCG CGCCGATGCG GGCGACATGG CCAATGCCAT GCGCTGGGCG 
TTCGAGGCGA CGGGCGAAGT GCTCGACCCG CACACCGCGA TTGGCCTTCA CGCGGCACGC 
GCGGCCGAAG GCATCCCTGC GGGCGTTCCG ATCGTGACGC TGGCGACGGC CCATCCGGCA 
AAGTTCGTCG ACGCGGTCGA GCGCGCCACC GGCGTTCGCC CGGGCCTGCC CGCCCGCGTG 
GGCGACCTGT TCGAGCGCGA AGAGCGCTGC GACCGCCTGC CCGGCAACTA CGAAGCGGTT 
GCCGCCTACG TCGCCGAGCG CGCGACTCCG AAGCATGGCT GA

Protein sequence

MKYVSTRGQA PSLDFQGVTL AGLASDGGLY VPESWPQFSH DEIAAMAGLP YARLAQKIMQ 
PYVGDCLTPE RLLELCEQAY GRFAHAAVTP LKQLDETQWV LELFHGPTLA FKDVALQLLG 
LLFEEFLARP REDGGDEHIT IVGATSGDTG SAAIDAVAGR AKVDIFMLHP HGRVSDVQRR 
QMTTVIAPNV HNIAIDGSFD DAQAMVKRMF NDSAMTGRFG IAAVNSINWA RLMAQVVYYF 
YAALQLGAPH RKVAFSVPTG NFGDVFAGYV AAKMGLPIER LIVATNVNDI LHRALSAGDY 
SASTVTPTAA PSMDIQVSSN FERLLFDGCG RDASALAAQM KHFEVTKAMQ LTNAQRESAA 
ALFSSARADA GDMANAMRWA FEATGEVLDP HTAIGLHAAR AAEGIPAGVP IVTLATAHPA 
KFVDAVERAT GVRPGLPARV GDLFEREERC DRLPGNYEAV AAYVAERATP KHG