Gene Saro_3172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3172
Symbol
ID	3918214
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	3387136
End bp	3388131
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	65%
IMG OID	640445956
Product	aldo/keto reductase
Protein accession	YP_498441
Protein GI	87201184
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGATTC AGCGCCGCCC GATCAACGGA CGCGAGACCA ACCCCATTGG TCTGGGATGC 
ATGTCGCTGA GCTGGGCCTA TGGCGGCCGG CCGAGCGACG AGGACGGCAT CCGCCTGCTC 
CAGCACGCCG TCGACATCGG CTACGATCAT TTCGACACCG CGCGGCTCTA TGGTCTCGGC 
CACAACGAGA CCCAGGTCGG GATCGCGCTC AAGGGCCGAC GCGACAAGGT TTTCCTGGCC 
TCGAAGATGG GCATCTTCGC CAGCGGCGAC AAGCGCGGCA TCGATTGCCA CCCGGACACG 
ATCCGCAGCG AACTCGAAGT CTCGCTCAGG CTGCTCCAGA CCGACCACAT CGACCTCTAC 
TACATGCACC GCCGCGATTT CACCGTGCCG ATCGAGGATT CGGTCGGCGC GATGGCCGAC 
CTCGTGAAGG AGGGCAAGAT CGGCGGCATC GGCCTGTCCG AAATGTCGGC TGACACGCTG 
CGCAAGGCTT CGGCGGTCCA CCCCATCGCC GCGATGCAGA CCGAATATTC ACCCTGGACC 
CGCCAGGCCG AAATCGCCGT CCTCGAGGCC TGCCGCGAGC TTGGCACCAC GTTCGTCGCC 
TTTTCGCCGG TCGCGCGCGG GGTTCTGGCC GATGGCGTGC ACGATCCCGC CGCGCTCGAG 
GAAAAGGACA TCCGGCGCGC CATGCCGCGC TTCATGGGCG ACAACTGGCC CAGGAACTAC 
GCGCTCGTCC GCCAGTTCAA TGCCATCGCC GCTCGCGAAG GCGTGACCCC GGCGCAGCTT 
TCGCTCGCCT GGGTCCTGTC GCGGGGCGAA CACGTCGTTG CCATTCCCGG CACCGGCAAG 
ATCGCTCACC TCGAAGAGAA CATCGCACGC TGGGACTGGG AAATCCCGGT TGCGGTCGCT 
GCCGAAGTCG ATGCCCTGAT CAACCAGCAG ACCGTCGCCG GTCACCGCTA TGCCGGGGTC 
ATGCTGCCGA CGATCGATAC CGAGGATTTC GACTGA

Protein sequence

MSIQRRPING RETNPIGLGC MSLSWAYGGR PSDEDGIRLL QHAVDIGYDH FDTARLYGLG 
HNETQVGIAL KGRRDKVFLA SKMGIFASGD KRGIDCHPDT IRSELEVSLR LLQTDHIDLY 
YMHRRDFTVP IEDSVGAMAD LVKEGKIGGI GLSEMSADTL RKASAVHPIA AMQTEYSPWT 
RQAEIAVLEA CRELGTTFVA FSPVARGVLA DGVHDPAALE EKDIRRAMPR FMGDNWPRNY 
ALVRQFNAIA AREGVTPAQL SLAWVLSRGE HVVAIPGTGK IAHLEENIAR WDWEIPVAVA 
AEVDALINQQ TVAGHRYAGV MLPTIDTEDF D