Gene Saro_0019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0019
Symbol
ID	3916061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	14577
End bp	15884
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	67%
IMG OID	640442744
Product	homoserine dehydrogenase
Protein accession	YP_495302
Protein GI	87198045
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAAC CATTGCGCAT CGCGCTGGCC GGACTTGGCA CGGTAGGCGG CGGAGTGATC 
CGGCTGATCG AGGCGAACGC CGATCTGATC GCGCGCCGCG CGGGCCGGCC GATAGTCATT 
ACCACCGTCA GCGCACGCAA TCGCGACAAG GACCGCGGCT TCGACGTGTC GCGCTATGCC 
TGGGAAGACG ACATGGTCAT CCTCGGCGAG CGTCCTGACG TGGACGTCGT GGTCGAACTC 
GTCGGCGGCG CCGATGGCCC CGCCTTGGCG CTCGCCCGGA CCACGTTCGA GGCCGGCAAG 
GCTCTTGTCA CGGCCAACAA GGCAATGATC GCGCACCACG GCGTGGAACT TGCCACAAAG 
GCAGAAGCCG CCAAGGTGGC GCTGAAATTC GAGGCTGCGG TCGCTGGCGG CATCCCCGTT 
ATCAAGGGAC TCAAGGAAGG CGTCGCCGCC AACGAGATCG CACGGGTCTA TGGCATTCTC 
AACGGCACCT GCAACTACAT CCTCTCGACG ATGGAAGACA CCGGCCGCGA TTTCGCCGAC 
GTTCTCGCCG AGGCGCAGGC CAAGGGCTAT GCCGAAGCCG ACCCGACCTT CGACATCGAC 
GGCATCGACG CCGCGCACAA GCTTTCGATC CTTTCGTCGA TCGCCTTCGG CACGGCGGTG 
GACTTCAAGC CCGTGGCCGC GACCGGCATC CGCCGCGTCC TTGCCGCCGA CATCGCGCAG 
GCAGATGTGC TCGGCTACTA TATCCGCCTG ATCGGCATGG CCGAGACGGA AATGGACGCT 
GCGGGCAACC GCCGCCTGTT CCAGCGGGTC CACCCGCACC TCGTCCATCG CGACCATCCG 
CTCGCCCATG TCGACGGCGC GACCAATGCG GTCGTCGCCG AGGGCAATTT CGTGGGCAGG 
CTGCTGTTCC AGGGCGCGGG GGCCGGCGAT GGTCCGACCG CCAGCGCCGT GGTCGCCGAT 
CTCATCGACA TCGCGCGCGG CGACATCGGC GCGCCCTTCT CGATCCCGGT CGCGGAACTG 
GAAAGGGCAG CTCCGGCCGA AACCGGCCAC CGCAGGGGCA AGGCCTATAT CCGGTTCAAC 
GTGGCCGATC GTCCGGGCGT GCTGGCCGAA ATCACCGCCG CCATGCGCGA CGCCGGGGTA 
TCGATCGAGA GCTTCATCCA GAAGGGTGGG CAGGACGATG CACCGGTCAT GGTGTCGATG 
GTCACGCACG AAGGCCCGGA AAGCGCCATC GCCGAAGCAC TGCGCCTTCT CGATGGCTCG 
CCCGTCCTGG CCGAGCCGCC GCTGGTCATG CACATCCTCG GCGAATGA

Protein sequence

MSEPLRIALA GLGTVGGGVI RLIEANADLI ARRAGRPIVI TTVSARNRDK DRGFDVSRYA 
WEDDMVILGE RPDVDVVVEL VGGADGPALA LARTTFEAGK ALVTANKAMI AHHGVELATK 
AEAAKVALKF EAAVAGGIPV IKGLKEGVAA NEIARVYGIL NGTCNYILST MEDTGRDFAD 
VLAEAQAKGY AEADPTFDID GIDAAHKLSI LSSIAFGTAV DFKPVAATGI RRVLAADIAQ 
ADVLGYYIRL IGMAETEMDA AGNRRLFQRV HPHLVHRDHP LAHVDGATNA VVAEGNFVGR 
LLFQGAGAGD GPTASAVVAD LIDIARGDIG APFSIPVAEL ERAAPAETGH RRGKAYIRFN 
VADRPGVLAE ITAAMRDAGV SIESFIQKGG QDDAPVMVSM VTHEGPESAI AEALRLLDGS 
PVLAEPPLVM HILGE