Gene Saro_2768 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2768
Symbol
ID	3916928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2987418
End bp	2988449
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	64%
IMG OID	640445547
Product	alcohol dehydrogenase
Protein accession	YP_498038
Protein GI	87200781
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACGC CAACCATGAT CGCAGCCGTT GTTGAGGAAG CCAACGGGCC CTTCGTTCTT 
CGCAAGCTTG CGCGTCCGCA GCCGGCCCCT GGCCAGGTAC TTGTACAGAT TGAGGCAAGC 
GGCACCAATC CGCTTGATGC CAAGATCCGG GCTGGCGAGG CACCGCATGC CCAGCAGCCT 
CTACCCGCAA TCCTCGGAAT GGACCTTGCA GGAACCGTCG TCGCGGTCGG GCCGGAGGTG 
GATAGTTTCC GCGTCGGCGA CGCTGTCTTC GGACTGACGG GTGGGGTCGG CGGACTGCAA 
GGCACACACG CGCAGTTCGC GGCGGTGGAT GCGCGCTTGC TGGCATCCAA ACCGGCTGCC 
CTGACCATGC GACAGGCGTC TGTTCTGCCG TTGGTCTTCA TCACCGCGTG GGAAGGTCTG 
GTGGATCGCG CGCAGGTGCA GGATGGACAG ACGGTTCTGA TCCAGGGCGG CGGCGGCGGT 
GTCGGCCATG TTGCCATACA GATCGCGCTT GCGCGGGGAG CCCGGGTGTT CGCAACCGCG 
CGGGGCAGCG ATCTCGAGTA TGTCCGAGAC CTTGGCGCCA CCCCGATCGA CGCCTCGAGA 
GAGCCCGAGG ATTACGCCGC CGAGCACACC GCAGGGCAGG GTTTCGACCT TGTCTACGAT 
ACGCTCGGTG GCCCGGTACT CGACGCCTCG TTCAGTGCCG TGAAGCGGTT TGGGCACGTG 
GTAAGCTGTC TCGGCTGGGG CACGCACAAG CTCGCCCCGC TCTCCTTCAA GCAGGCGACG 
TATTCGGGCG TGTTCACGCT GCACACCCTG TTGGCAAACG AGGGTCTGGC CCACTTCGGC 
GAGATGCTGA GAGAGGCTGA CGCGCTCGTT CAGACGGGCA AACTCGCCCC TCGTCTCGAT 
CCACGGACCT TCTCCATCGC GGAAATCGGT TCTGCCTATG ACGCGGTCCT CGGTCGCAAC 
GACGTGCCAC GGCAGCGAGG AAAGATCGCG ATCACGGTCG AACCGCAATT CAACCTTCAC 
GAGCAGCGCT GA

Protein sequence

MTTPTMIAAV VEEANGPFVL RKLARPQPAP GQVLVQIEAS GTNPLDAKIR AGEAPHAQQP 
LPAILGMDLA GTVVAVGPEV DSFRVGDAVF GLTGGVGGLQ GTHAQFAAVD ARLLASKPAA 
LTMRQASVLP LVFITAWEGL VDRAQVQDGQ TVLIQGGGGG VGHVAIQIAL ARGARVFATA 
RGSDLEYVRD LGATPIDASR EPEDYAAEHT AGQGFDLVYD TLGGPVLDAS FSAVKRFGHV 
VSCLGWGTHK LAPLSFKQAT YSGVFTLHTL LANEGLAHFG EMLREADALV QTGKLAPRLD 
PRTFSIAEIG SAYDAVLGRN DVPRQRGKIA ITVEPQFNLH EQR