Gene Saro_1864 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1864
Symbol
ID	3917085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1964998
End bp	1966011
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	67%
IMG OID	640444608
Product	alcohol dehydrogenase
Protein accession	YP_497138
Protein GI	87199881
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.410641
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCAAT GGCTTGTTGC GAAGGGGTCG ACCTCGCTCG ACGATCTGAG AATGGGCGAC 
GTGCCGGTCC CGCAACCGGG TGCGGGTGAG GTGCTGGTAC GGGTTCATGC CTGCTCGCTG 
AACTATCGCG ACCAGATCAT TCCCCTGGGC TTCTACATGG GCGGCGTGGT GCAGCATGAC 
ACTGTGCCGC TTTCCGATGG CGCGGGCGAA ATCGTAGCGG TGGGTGAGGG TGTTTCCTCG 
TTCAAGGTCG GCGACCGGGT GGCCGGGCTC TTCTTCCAGA ACTGGAACGA CGGTCCGCCG 
AACCCCGGCG TGGGCCCCGC GCTGGGCGCG CCGCCGGCGC AGGGGATGCT TCAGGATTAC 
GTCGTGCTGC CCGAGCACGG TGTCGTGCGC CTTGCCGCGA CGCTGGACTA TACCGAGGCG 
GCATGCCTGC CCTGCGCCGG CGTCACTGCC TGGAACGCGC TGATGGAAGG CCCGCGTCCT 
GTGAAGGCAG GCGACAGCGT GCTGGTGCTG GGCACCGGCG GCGTGTCGCT GCTGGCCTTG 
CAGATCGCCA AGGCCGCAGG AGCGACGGTG ATCGCGACGT CTTCGTCGGA CGAGAAGCTG 
GAGCGGGTCA AGGCGCTCGG CGCGGACCAT GTGATCAATT ACCGCACGAC GCCCGAATGG 
GGCGCGGAAG CGGCCCGGCT TGCCGGCGGC GGGGTGGACA AGGTCGTCGA GGTTGGCGGG 
GCGGGCACGC TTTCGCAGTC GATCGCGGCG GTCGGCTTCG CCGGCGAGAT CGCGCTGATC 
GGCGTGCTGA CGCGCGAGGG TGACACCAAC CCGCACGGGC TGATGTTCAA GGGCGCATCG 
ATCCGCGGGA TCTTCGTCGG CTCGAAGGGC ATGGCCGAAC GTCTCAACGC CTTCATCGAC 
GCGCACGGCA TCAAGCCGGT CGTCGACCGG GCGTTCCCCA TCGAGCAGGC AATGGATGCC 
TATTCCTATC AATCTTCGCC GGGGCTCTTC GGGAAGGTCG CAATAACCCT TTGA

Protein sequence

MRQWLVAKGS TSLDDLRMGD VPVPQPGAGE VLVRVHACSL NYRDQIIPLG FYMGGVVQHD 
TVPLSDGAGE IVAVGEGVSS FKVGDRVAGL FFQNWNDGPP NPGVGPALGA PPAQGMLQDY 
VVLPEHGVVR LAATLDYTEA ACLPCAGVTA WNALMEGPRP VKAGDSVLVL GTGGVSLLAL 
QIAKAAGATV IATSSSDEKL ERVKALGADH VINYRTTPEW GAEAARLAGG GVDKVVEVGG 
AGTLSQSIAA VGFAGEIALI GVLTREGDTN PHGLMFKGAS IRGIFVGSKG MAERLNAFID 
AHGIKPVVDR AFPIEQAMDA YSYQSSPGLF GKVAITL