Gene Saro_1668 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1668
Symbol
ID	3918777
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1748389
End bp	1749789
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	67%
IMG OID	640444409
Product	aldehyde dehydrogenase
Protein accession	YP_496942
Protein GI	87199685
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGTTTG AACGCATCAA TCCGATGACC GGCGCCGTCG CCTCGCAGGC AGAGGCCATG 
AAAGCGTCGG ACATTCCTTC CATTGCTGCC CGCGCAGGAC AGGCCTTTCC GGCGTGGGCC 
GCGATGGGCC CCAACGCACG TCGCGGCGTA CTGATGAAGG CGGCTGCGGC GCTCGAAGCG 
CGGGCCGACG CTTTCGTCGA GGCCATGATG GGCGAGATCG GCGCGACCAG GGGCTGGGCG 
CTGTTCAACC TCGGCCTTGC CGCCAGCATG GTGCGCGAAG CCGCCGCGCT GACCACGCAG 
ATCTCGGGAG AGGTCATTCC CTCGGACAAG CCGGGCTGCA TTTCGATGGC TCTGCGCGAA 
CCGGTTGGCG TGATTCTGGG CATCGCGCCG TGGAATGCGC CGATCATCCT TGGCGTGCGC 
GCCATTGCCG TGCCGCTCGC CTGCGGCAAC GCGGTGATAC TCAAGGCCAG CGAAACCTGT 
CCGCGCACCC ACGCGCTCAT CATCGAGGCC TTCGCCGAAG CCGGCTTCCC CGAAGGCGTG 
GTCAATGTCG TGACGAACGC GCCTGCCGAC GCAGCGGAAG TGGTCGGCGC GCTGATCGAT 
GCGCCGGAAG TGCGCCGCAT CAACTTCACC GGCTCGACCA ATGTCGGCAG GATCATCGCA 
AAGCGCGCGG CCGAGCATCT CAAGCCCTGC CTGCTCGAAC TGGGCGGCAA GGCACCGCTG 
ATCGTCCTGG ACGATGCGGA CCTCGACGAA GCGGTCAAGG CCGCGGCTTT CGGCGCCTTC 
ATGAACCAGG GCCAGATCTG CATGTCGACG GAGCGGATCA TCGTGGTCGA TGCCGTTGCC 
GATGCCTTCG CCGATAAGTT CAAGGCCAAG GTCGCCTCGA TGGCTGTCGG CGACCCGCGC 
GAGGGCACGA CCCCGCTCGG CGCCGTCGTC GACGCGAAGA CCGTCGCTCA CTGCCGCAGC 
CTGATCGACG ATGCCCTGGC CAAGGGCGCC CGTCTGCTGA CCGGCGGCGA AACCACGCAC 
AACGTGCTCA TGCCCGCCCA TGTCGTCGAT GGCGTGACGC AGGACATGAA GCTGTTCCGC 
GACGAGAGCT TCGGCCCCGT GGTCGGCGTG ATCCGCGCGC GCGACGAAGC CCATGCCATC 
GAACTGGCGA ACGACAGTGA ATACGGCCTG TCGGCGGCCG TTTTCACCCG CGACACCGCG 
CGCGGCCTGC GCGTCGCCCG CCAGATCCGT TCGGGCATCT GCCATGTCAA CGGCCCGACC 
GTCCACGACG AGGCGCAGAT GCCTTTCGGT GGAGTGGGCG CGTCCGGCTA CGGCCGCTTT 
GGCGGCAAGG CCGGCATCGA CAGTTTCACC GAGCTGCGCT GGATCACGAT GGAAACCCAG 
CCCGGCCACT ATCCCATTTG A

Protein sequence

MQFERINPMT GAVASQAEAM KASDIPSIAA RAGQAFPAWA AMGPNARRGV LMKAAAALEA 
RADAFVEAMM GEIGATRGWA LFNLGLAASM VREAAALTTQ ISGEVIPSDK PGCISMALRE 
PVGVILGIAP WNAPIILGVR AIAVPLACGN AVILKASETC PRTHALIIEA FAEAGFPEGV 
VNVVTNAPAD AAEVVGALID APEVRRINFT GSTNVGRIIA KRAAEHLKPC LLELGGKAPL 
IVLDDADLDE AVKAAAFGAF MNQGQICMST ERIIVVDAVA DAFADKFKAK VASMAVGDPR 
EGTTPLGAVV DAKTVAHCRS LIDDALAKGA RLLTGGETTH NVLMPAHVVD GVTQDMKLFR 
DESFGPVVGV IRARDEAHAI ELANDSEYGL SAAVFTRDTA RGLRVARQIR SGICHVNGPT 
VHDEAQMPFG GVGASGYGRF GGKAGIDSFT ELRWITMETQ PGHYPI