Gene Saro_1174 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1174
Symbol
ID	3916471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1214075
End bp	1215076
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	69%
IMG OID	640443910
Product	alcohol dehydrogenase
Protein accession	YP_496453
Protein GI	87199196
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.755357
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCTC TGCGCACCCA CGCGGCAGGC GGCCCCGAAA CCCTCGTGCT CGACGATCTG 
CCCGATCCGG TGCCGGGCAA GGGCGAAGTG CTGGTGCGGG TCCATGCCTG CTCGATAAAC 
TTCCCCGACA CCCTGATGAT CCGCGACCTC TACCAGTTCC GGCCCGAGCG CCCCTATGCG 
CCGGGCAGCG AACTGGCGGG CGAGATCGAG GCGCTGGGCG AGGGCGTCAC CGGCTGGAAG 
GTTGGCGACC GCGTAATCGC GATGATCGGC AGCGGCGGCC TTGCCGAAAA GGTCATTGCC 
CCGGTCGCGC GCCTGTTTCC GCTGCCCGAC GGCGTCGACT ACGCCACCGG CGCCTCACTG 
CTGATGACCT ACGGCACGAC GATCCACGGC CTCAAGGATC GCGGCCATAT CAAGGCCGGC 
GACACGGTGC TCGTCCTCGG CGCGGCTGGC GGCGTCGGGC TTTCGGCCGT CGAACTCGCC 
AAGGCCTTCG GCGCCCGCGT CATCGCCGCC GTGTCGAGCG AGGAGAAGGC GCAGGTCGTG 
CGCGAGGCCG GCGCTGACGA CGTCGTCATC TACGGCCGGC CGCCTTTCGA CAAGGCCCAG 
TCCAAGGCGC TGGCCGACCA GTTCAAGGCC GCCTGCGGCC CGAACGGCGC GGACATCGTC 
TACGATATCG TCGGCGGCGA CTATTCCGAG CCCGCCCTGC GTGCCATCGC ATGGGAGGGC 
CGTTTCCTCG TGGTCGGCTT CCCGGCGGGC ATCGCCAAGC TCCCGCTCAA CCTCACGTTG 
CTCAAGTCCT GCGACGTCTG CGGCGTGTTC TGGGGGGCGT GGACCGCGCG CGAACCCGCC 
GCCTTCAAGG CCGAGGTCGA GGAACTGTTC GCCCTGCTCA AGGCCGGCAA GATCAACCCA 
CGCGTCTCGC AGCGCTTCTC GCTCGAACAG GGCCGCGAAG CCATCGCCAC GCTGGAAAAC 
CGGCAGGCCA TGGGCAAGGT CGTCGTTGAA ATGATCGGCT GA

Protein sequence

MKALRTHAAG GPETLVLDDL PDPVPGKGEV LVRVHACSIN FPDTLMIRDL YQFRPERPYA 
PGSELAGEIE ALGEGVTGWK VGDRVIAMIG SGGLAEKVIA PVARLFPLPD GVDYATGASL 
LMTYGTTIHG LKDRGHIKAG DTVLVLGAAG GVGLSAVELA KAFGARVIAA VSSEEKAQVV 
REAGADDVVI YGRPPFDKAQ SKALADQFKA ACGPNGADIV YDIVGGDYSE PALRAIAWEG 
RFLVVGFPAG IAKLPLNLTL LKSCDVCGVF WGAWTAREPA AFKAEVEELF ALLKAGKINP 
RVSQRFSLEQ GREAIATLEN RQAMGKVVVE MIG