Gene Saro_3899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3899
Symbol
ID	5077383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009426
Strand	-
Start bp	68869
End bp	69966
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	61%
IMG OID	640481006
Product	alcohol dehydrogenase
Protein accession	YP_001165668
Protein GI	146275507
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.323018
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGCAT ACGCGGCAAT TATCGAGCGT CAAGGCGGCG AATTCGTTCT GGATAACGTC 
TCTATCGAGG ATCCGCGCGA CGGCGAAGTG CTGGTCAAGG TTGCCGCAGC TGGCATGTGT 
CATACCGACC TGACGGTTCG CGATCAATAT TACCCGACGC CGCTGCCGGC GGTGCTGGGC 
CATGAAGGTT CGGGCGTTGT CGAAAAGGTC GGACGTGGCG TCACCACTGT CAAGCCAGGC 
GACAAGGTCG TGCTCTCCTT CAGCTATTGC GGCACCTGTC CATCGTGCCT CAAGGGGCAT 
CAGGCCTATT GTCCGAGCCT GTTCCCGCTC AATTTCATGG GCCGCCGCCT GGATGGTTCG 
ACGCCGATTA CCCGCAACGG CCAAGAGGTC AACGCCTGCT TCTTCGGGCA ATCCTCGTTC 
GCGACCTATT CGATCGCGTC GGAAAACAAC TGCGTCAAGG TTGCCGACGA CGCACAGATC 
GAACTTTTGG GCCCACTGGG CTGCGGCATC CAGACCGGGG CGGGCAGCAT CCTCAATGCG 
CTTTGTCCCG AACCTGGCTC CTCGATCGCG ATCTTCGGGG TCGGGTCGGT CGGCCTCAGC 
GCCGTGATGG CCGCCAAGGC CTCGGGCTGC CTCAAGATCA TCGCGGTTGA CCGCAACGCA 
GGCCGCTTGG AACTGGCGCG TGAACTGGGC GCCACCGATG TGATCGACGC CAACACGGTC 
AACGCTCAGG AAGCGATCGT CGCGATGACC GGTGGCGGCG CCGACTATGC CATGGATACC 
ACCGCCATTC CAGCGGTGCT GCGCTCGGCG GTGGACAGCA CGCACAACAT GGGTGAAACC 
GCAGTGGTCG GCGGGGCGAA GCTGGGCACC GAGTTTTCGC TAGACATGAA CAACATGCTG 
TTTGGCCGCA AGTTGCGCGG CGTAGTCGAA GGATCGAGCA CCCCGCAGGT CTTCATCCCG 
CAACTGATTG CGATGCAGAA GGCCGGGCTG TTCCCGTTCG AGAAGCTCTG CACCTTCTAT 
GATCTCGACC AGATCAACCA GGCCGTCGAG GATACCGAAA AGACCGGCAA GGCGATCAAG 
GCCATTCTCA AAATGTAG

Protein sequence

MDAYAAIIER QGGEFVLDNV SIEDPRDGEV LVKVAAAGMC HTDLTVRDQY YPTPLPAVLG 
HEGSGVVEKV GRGVTTVKPG DKVVLSFSYC GTCPSCLKGH QAYCPSLFPL NFMGRRLDGS 
TPITRNGQEV NACFFGQSSF ATYSIASENN CVKVADDAQI ELLGPLGCGI QTGAGSILNA 
LCPEPGSSIA IFGVGSVGLS AVMAAKASGC LKIIAVDRNA GRLELARELG ATDVIDANTV 
NAQEAIVAMT GGGADYAMDT TAIPAVLRSA VDSTHNMGET AVVGGAKLGT EFSLDMNNML 
FGRKLRGVVE GSSTPQVFIP QLIAMQKAGL FPFEKLCTFY DLDQINQAVE DTEKTGKAIK 
AILKM