Gene Saro_1724 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1724
Symbol
ID	3916299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1812584
End bp	1814701
Gene Length	2118 bp
Protein Length	705 aa
Translation table	11
GC content	65%
IMG OID	640444465
Product	short chain dehydrogenase
Protein accession	YP_496998
Protein GI	87199741
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only [S] Function unknown
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases) [COG3347] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02632] rhamnulose-1-phosphate aldolase/alcohol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.616533
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCTC AGACCGAGAC CTTGATTGCC GCTGCCGCCA TTCCGTTCGC GGTTCCGACC 
AGCCGTTGGG ACGATGCCGT CGCGGCAAAG CTCGGCCCGG CAGAACTTCT GCTCTATCGC 
TCGAACCTGC TCGGTTCCGA TCTTACCGTC ACCAACTTCG GTGGCGGCAA TACGTCGGCC 
AAGCTTGAAG AGATGGATCC GCTGACTGGT GAGCCGGTCG AAGTGCTGTG GGTCAAGGGT 
TCGGGCGGTG ACATCGGCTC TATGAAGATC GACGGCTTTG CCACTCTTTA CCAGGCAAAG 
CTGCTTGGCC TCGAGGCGCA CTATGCCGGG CCGCAGGACG ACGACAAGAT GGTCGGCTTC 
CTGCCGCACT GCACGTTCAA CCTCAACTGT CGCGCGGCCA GCATTGATAC GCCGCTGCAC 
TCGCTGCTGC CCTTCGCGCA TGTCGATCAC GTCCATCCCG ATGCGATCAT CGCGCTGGCC 
GCTTCCTCGG GGGGCGAGGC CGCCACGAAG GAAATCTGGG GCGGCCGGAT CGGCTGGCTG 
CCGTGGAAGC GTCCCGGCTA CACCCTTGGC GTGATGCTCC GCGATTTCGT CAAGGCTAAC 
CCGGGCGTCG AAGGTGTCAT GCTTGCCGGC CATGGCATCA TCTGCTGGGC CGACAGCGCC 
AAGGCCTGCT ATGAACATAC CGTTCGGCTG ATCGCGGACG CGGCCGGCTA TCTCAATGCC 
CGGCTCGCCG AAAAGCCAGC GTTCGGAGGT CGGAAAGTGG CGCCGAACCC GGATCGGGCA 
AAGATCGCCG CCGACCTCAT GCCTCGCCTG CGTGGCTTCA TGACCGGTGC GCGCAACAAG 
CTTGGGCACT TCTCGGACGA TGCCGAGGCG CTGGAGTTCG TTGGCTCGGT GGACTTCGAG 
CGTCTCGCCG CGCTTGGCAC CTCGTGCCCC GACCATTTCC TGCGCACCAA GATCGCGCCG 
CTGACGCTCG ATCCCTCGCG GCTGCAAGAC GACGACTACC TCGCGCGGAA GATTGCCGGC 
TATCGCGATC TCTATGCGGC CTATTATGAA CGCTGCAAGC GCCCGAACTC GCCGGCAATG 
CGCGATTCCA ACCCTGTCGT CGTGCTCGTC CCGGGCGTCG GACGCATCAC GTTCGCCACC 
GACAAGACCA CCGCGCGGCT CGCTGGCGAA TTCTACGGCA ACGCCATCAA CGTGATGCGC 
GGGGCCGAAG CCATCGGCGA TTACATTGCG CTCGATGAGC AGGAAGCCTT CGACATCGAA 
TACTGGCTGC TCGAAGAGGC CAAGCTCCAG CGCATGCCTG CGCCCCGGCC TCTGGTCGGC 
AAGATCGCGC TGGTCACCGG CGGGGCAGGG GGCATCGGCG CGGCATCGGC CGCCCGCCTG 
CTGCGCGAAG GCGCCTGCGT CGTGCTGGCC GATCGTGCCG CCGACGCGGT CGAGGACGTC 
CGCGCCGGTT TCGCAAGGCA GTTCGGCAAC GACGTCGTGC GCGCGGCCGT CTGCGACGTG 
ACCGACGAGG CGCAGGTCCA GGCTGCTTTC GACGTGGCCG CACGTGAATT TGGCGGGCTC 
GACATTCTGG TCGCCAACGC CGGCATCGCA TCTTCTGCAC CGCTCGAGGA AACGACCGTC 
GATCTGTGGA ACCGCAACTA CGACGTCCTC GCGCAGGGGT ATTTCCTGAC CTCCCGCTCC 
GCCTGGCCGC TCATGAAGCG CATGAAGGAG CAGGGCGGCG CGTCTGTCGT GTTCATCGGT 
TCCAAGAACG GCGTTGCCGC CGCTACGAAC GCCAGTGCCT ATGCTTCCGC GAAGGCTGCC 
GCGAACCATC TCGCGCGGTG CCTCGCGCTT GAAGGCGCGC CGTTCGGCAT CCGCGTCAAT 
ACCGTCAACC CCGATGCCGT CATCAAGGGC AGCAAGATCT GGGACGGCGA CTGGCGCAAG 
GAACGCGCCG GGGCCCACGG CATCGACAGC GGCAAGGAAC TGGAAGAGCA CTACCGCCAG 
CGCTCGATGC TCAAGCGCGA TGTTCTGCCC GAAGATATCG CGGAAGCAGT CTATTTCCTC 
GCTTCGGACA TGTCGGCAAA ATCCACCGGC AACATGATCA ACGTTGATGC GGGGAACGCC 
CAGGCCTTCA CTCGCTGA

Protein sequence

MNAQTETLIA AAAIPFAVPT SRWDDAVAAK LGPAELLLYR SNLLGSDLTV TNFGGGNTSA 
KLEEMDPLTG EPVEVLWVKG SGGDIGSMKI DGFATLYQAK LLGLEAHYAG PQDDDKMVGF 
LPHCTFNLNC RAASIDTPLH SLLPFAHVDH VHPDAIIALA ASSGGEAATK EIWGGRIGWL 
PWKRPGYTLG VMLRDFVKAN PGVEGVMLAG HGIICWADSA KACYEHTVRL IADAAGYLNA 
RLAEKPAFGG RKVAPNPDRA KIAADLMPRL RGFMTGARNK LGHFSDDAEA LEFVGSVDFE 
RLAALGTSCP DHFLRTKIAP LTLDPSRLQD DDYLARKIAG YRDLYAAYYE RCKRPNSPAM 
RDSNPVVVLV PGVGRITFAT DKTTARLAGE FYGNAINVMR GAEAIGDYIA LDEQEAFDIE 
YWLLEEAKLQ RMPAPRPLVG KIALVTGGAG GIGAASAARL LREGACVVLA DRAADAVEDV 
RAGFARQFGN DVVRAAVCDV TDEAQVQAAF DVAAREFGGL DILVANAGIA SSAPLEETTV 
DLWNRNYDVL AQGYFLTSRS AWPLMKRMKE QGGASVVFIG SKNGVAAATN ASAYASAKAA 
ANHLARCLAL EGAPFGIRVN TVNPDAVIKG SKIWDGDWRK ERAGAHGIDS GKELEEHYRQ 
RSMLKRDVLP EDIAEAVYFL ASDMSAKSTG NMINVDAGNA QAFTR