Gene Saro_0874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0874
Symbol
ID	3917959
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	929439
End bp	930590
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	65%
IMG OID	640443607
Product	alcohol dehydrogenase
Protein accession	YP_496153
Protein GI	87198896
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID	[TIGR02818] S-(hydroxymethyl)glutathione dehydrogenase/class III alcohol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.101876
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTATCGG ACCGCCACGT CAAAGGGAGA CCGCACGAAA TGAAGACCCG CGCCGCAGTT 
GCGTTCGCGC CCAAGCAGCC GCTCGAGATC GTCGAACTGG ACCTCGAAGG CCCCAAGGCT 
GGCGAAGTGC TGGTCGAGAT CATGGCGACC GGCGTGTGCC ACACCGATGC CTACACGCTC 
GACGGGTTCG ACAGCGAAGG CATCTTCCCC AGCGTGCTGG GCCACGAAGG CGCCGGTATC 
GTGCGCGAGG TGGGCCCTGG GGTCACTTCG GTGAAGCCCG GCGATCACGT GATCCCGCTC 
TACACGCCGG AATGCCGCCA GTGCAAATCG TGCCTCTCGG GCAAGACCAA CCTGTGCACC 
GCGATCCGCG CCACGCAAGG GCAGGGCCTG ATGCCCGACG GCACCAGCCG CTTTTCGTAC 
AAGGGCCAGA CCGTGTTCCA CTACATGGGC TGCTCGACCT TCTCTAACTT CACCGTCCTG 
CCCGAGATCG CGGTTGCCAA GATCCGCGAG GACGCGCCGT TCAAGACCTC GTGCTATATC 
GGCTGCGGCG TGACGACGGG CGTCGGCGCG GTGATCAACA CCGCCAAGGT CCAGGTCGGT 
GACAACGTCG TGGTCTTCGG CCTCGGCGGC ATCGGCCTCA ACGTGATCCA GGGCGCGCGG 
CTTGCCGGTG CCGGCAAGAT CATCGGCGTC GACATCAACC CCGACCGCGA GGAATGGGGC 
CGCAAGTTCG GCATGACCGA CTTCCTCAAC AGCAAGGGCA TGAGCCGCGA GGACGTCGTC 
GCCAAGGTCG TCGCCATGAC CGACGGCGGC GCGGACTACA CCTTCGACGC CACCGGCAAC 
ACCGAAGTGA TGCGCACGGC GCTTGAAGCC TGCCATCGCG GCTGGGGCAC CTCCATCATC 
ATCGGCGTGG CCGAGGCGGG CAAGGAAATC AGCACGCGTC CGTTCCAGCT CGTCACCGGC 
CGCAACTGGC GCGGCACGGC CTTCGGCGGC GCCAAGGGCC GCACCGACGT GCCCAAGATC 
GTCGACATGT ACATGACCGG CAAGATCGAG ATCGACCCGA TGATCACCCA TGTCATGGGC 
CTGGAAGAGA TCAACACCGC CTTCGACCTG ATGCACGCCG GCAAGTCGAT CCGTTCAGTC 
GTGGTGTTCT GA

Protein sequence

MLSDRHVKGR PHEMKTRAAV AFAPKQPLEI VELDLEGPKA GEVLVEIMAT GVCHTDAYTL 
DGFDSEGIFP SVLGHEGAGI VREVGPGVTS VKPGDHVIPL YTPECRQCKS CLSGKTNLCT 
AIRATQGQGL MPDGTSRFSY KGQTVFHYMG CSTFSNFTVL PEIAVAKIRE DAPFKTSCYI 
GCGVTTGVGA VINTAKVQVG DNVVVFGLGG IGLNVIQGAR LAGAGKIIGV DINPDREEWG 
RKFGMTDFLN SKGMSREDVV AKVVAMTDGG ADYTFDATGN TEVMRTALEA CHRGWGTSII 
IGVAEAGKEI STRPFQLVTG RNWRGTAFGG AKGRTDVPKI VDMYMTGKIE IDPMITHVMG 
LEEINTAFDL MHAGKSIRSV VVF