Gene Saro_1476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1476
Symbol
ID	3916141
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1518089
End bp	1519171
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	63%
IMG OID	640444219
Product	alcohol dehydrogenase, zinc-containing
Protein accession	YP_496753
Protein GI	87199496
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.209599
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGGGAC GTGCATCGGT GCTGGTAAAA CCGAACCAAC TGGAGACTTG GGACGTCAAA 
GTCGCCGATC CGGAACCGGG CGGTGCCCTG GTTTCGATCG TGCTGGGCGG GGTATGCGGC 
AGCGACGTCC ACATCTTGAC CGGCGAGGCT GGCGTGATGC CCTTCCCCAT CATTCTGGGC 
CATGAGGGCG TGGGACGCAT CGAGAAGCTG GGGCACGGCG TCAGCACTGA CTACGCTGGC 
GAGGAACTTA AGCCCGGCGA TCTGGTATAT TGGTCGCCGA TCGCGCTGTG CCATCGATGC 
TATTCCTGCA ATGTTCTCGA CGAGACACCT TGCGAAAATA CCCAGTTCTT CGAAGATGCT 
TCCAAGCCGA ACTGGGGTAG CTACGCCGAT TATGCATGGC TGCCCAACGG CATGCCGTTC 
TATAAGCTAC CAGCCCAAGC GCAGCCCGAA GCGGTCGCTG CGCTTGGCTG CGCCCTTCCA 
ACCGCCCTGC GCGGCTTTGA TCGCTGCGGC TCGGTTCGCG TCGGTGAAAC TGTGGTTGTC 
CAAGGTGCAG GCCCTGTCGG CCTGTCGGCG GTGCTCGTGG CGGCGCAGGC CGGGGCGCGT 
GACGTGATCG TTATTGACGG CTCACCACTT CGTCGCGAAG CGGCCACCGC ATTGGGCGCC 
TCGCTGACGA TCGGCCTCGA CGTCGCGCCC GAGGAACGGC GCCGAATGAT TTACGATCGC 
GTTGGTCGCA ATGGCCCCAA TGTCGTCATC GAGGCAGCCG GAGTTCTGCC AGCGTTCCCC 
GAAGGCGTGG ACCTGACCGG CAACCACGGC CGCTACATCG TGCTAGGACT TTGGGGCGCC 
ATAGGCACTC AACCGATCAG CCCGCGCGAC CTCACAATCA AGAACCTGAC TATCGCTGGT 
GCGACCTTCC CCAAGCCCAA GCATTATTAC CAGGCCTTGC ATTTGGCGAC AGCCCTGCAG 
GACCGTGTAC CGCTAGCCGG TCTGGTCAGC CACCGGTTCG GCGTCAGCCA GGCGGGCGAA 
GCGCTGAGTC TCACCAAGAG TGGCACAGCG ATCAAGGCCG TGATCGATCC GACGATCACC 
TGA

Protein sequence

MLGRASVLVK PNQLETWDVK VADPEPGGAL VSIVLGGVCG SDVHILTGEA GVMPFPIILG 
HEGVGRIEKL GHGVSTDYAG EELKPGDLVY WSPIALCHRC YSCNVLDETP CENTQFFEDA 
SKPNWGSYAD YAWLPNGMPF YKLPAQAQPE AVAALGCALP TALRGFDRCG SVRVGETVVV 
QGAGPVGLSA VLVAAQAGAR DVIVIDGSPL RREAATALGA SLTIGLDVAP EERRRMIYDR 
VGRNGPNVVI EAAGVLPAFP EGVDLTGNHG RYIVLGLWGA IGTQPISPRD LTIKNLTIAG 
ATFPKPKHYY QALHLATALQ DRVPLAGLVS HRFGVSQAGE ALSLTKSGTA IKAVIDPTIT