Gene Saro_3836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3836
Symbol
ID	5077447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009426
Strand	-
Start bp	2809
End bp	3795
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	63%
IMG OID	640480946
Product	dihydrodipicolinate synthetase
Protein accession	YP_001165608
Protein GI	146275447
COG category	[E] Amino acid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0329] Dihydrodipicolinate synthase/N-acetylneuraminate lyase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCGCGTG AACTGCTGAC TGCTGCTGAT GTGAAGGGTG CTTGGGCGAT CGTGCCGACT 
CCAGCCAAGG AAGGTGCCTC CGACTGGCGC GCCGCTGATA CTGTTAATGT CGAAGAAGCA 
GCCCGCATGA TCGACGGCCT GATCGAGGCC GGGGTCGATG GCATTCTCAG TATGGGGACG 
CTGGGCGAGG CCGCAACCAT GACACTTGAC GAAAAGCTCG TCTTTATGAA GACTATCGTC 
GATACCGCCG CGGGCCGGGT GCCGGTGTTT GTCGGGACAA CCTGCATCAA CACCCGCGAC 
ACCATTGCGC TAACCCGCAA GGCAGTCGAT ATCGGCGCGA CCGGGACGAT GTTGGGCGTA 
CCGATGTGGT GCGCCCCCAG TGTCGACGTC GCGGTACAGT TCTATCGCGA CGTTGCCGAG 
GCGGTGCCCG ACATCAACAT CGCGATCTAT GCCAACCCCG AAGCCTTCAA GTTCGATTTC 
CCGCGCACGT TCTGGGGCCA GGTCGCCGAA ATTCCGCAGG TTGTCACCGC CAAGTACATC 
GGCGTCGGCA CCCTGCTGCC CGATCTCGCG GCGATCAAGG GGCGGATCAA GCTGCTGCCG 
ATCGATTTCG ATTACTACGG CGCGGCGCGG ATGGACGATT CGATCGACGC CTTCTGGACC 
AGCGGCGCGG TCTGCCACCC GCTGGTCAGC ACGACCCTGC GCGATGTGGT CGCCGCAGCG 
CGCGCGAGCG GCGACTGGAG CGCTGCCAAG GCTTTCATGG GCCGGCTCGC GCCGACTGCG 
GCGACGCTTT TCCCGAACGG CAGCTTCAAG GAATTCTCGA CCTACAACAT CCCCCTGGAA 
AAGGCGCGGA TGACCGCCGG CGGCTGGATG AATGCCGGGC CTTGCCGTCC GCCCTATCAC 
CTGTGTCCCG AAAACTATCT CGAAGGCGCG CGCAATTCAG GCAGGATGTG GGCTGAACTG 
GGCAAGGCGC TCGAGGCAGA GCGTTGA

Protein sequence

MARELLTAAD VKGAWAIVPT PAKEGASDWR AADTVNVEEA ARMIDGLIEA GVDGILSMGT 
LGEAATMTLD EKLVFMKTIV DTAAGRVPVF VGTTCINTRD TIALTRKAVD IGATGTMLGV 
PMWCAPSVDV AVQFYRDVAE AVPDINIAIY ANPEAFKFDF PRTFWGQVAE IPQVVTAKYI 
GVGTLLPDLA AIKGRIKLLP IDFDYYGAAR MDDSIDAFWT SGAVCHPLVS TTLRDVVAAA 
RASGDWSAAK AFMGRLAPTA ATLFPNGSFK EFSTYNIPLE KARMTAGGWM NAGPCRPPYH 
LCPENYLEGA RNSGRMWAEL GKALEAER