Gene Saro_3484 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3484
Symbol
ID	5077633
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	86640
End bp	88049
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	64%
IMG OID	640481208
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001165870
Protein GI	146275710
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGACC GCGATCCCGG CGCATTCGAC AAGGCCCGCT GCCCCGGCAC TAGCTGGGAA 
GACATCCTGC GCGCCGACGA GGTGCAGCCG CCCGCCTTCA TGGCGGAGGA CCGTTCGCAG 
TATCTCGGCT CAGAACCGAT CGATGCAGCG CGATACTACA GCCCCGAATT CTTCAAGACC 
GAGTGCGAAA GGATGTGGCC CTTCGTCTGG CAGTTCGCCG CGCGCGAGGA AGATCTGCCC 
GAGCCGGGCG ACTACGTAAC CTACGACAAC GCGGGTCGGT CCTACCTGAT CGTGCGGCAA 
GAGGACGGCA GTCTCAAGGC GTTCCATAAT GTCTGCCTGC ACCGCGGCCG CAAGCTCAAG 
ACGGACAGCG GCAGCGCAGA ACAGTTCCTC TGTCCGTTCC ACGGCTTCTC GTGGAATCCG 
GACGGCTCGT TGCGCAACAT CCCCTGCCGC TGGGACTTTG CCCACCTCAG CGACCAGAAG 
ATGCAGCTTC CCGAGGCGAG CCTTGCGCAG TGGGGCGGCT ATGTCTTCGT CCGCGATGCT 
GCCGAGGGGC CGACCATCGA GGAATACCTC GATCCGCTTC CGGAGTTCTT CAAGCGCTGG 
AAGCACGAGG AATGCGTGAC GGTTGCCTGG GTCGCCAAGG TGATCCCGGC AAACTGGAAG 
ATTGCGATGG AGGCTTTCAT GGAAAGCTAC CACGCCTATG TCACGCACCC GCAGCTCATG 
CCGTTCACCG GCGATGCCAA CGCGGCCTAC CACGTGCTCG GCCGCCACGT GAACGTGAAC 
TACACGCCCT TCGGCGTCGT CAGCCCGCAC ATCGAGGCGC AAGCCGAGGC CGAGCACTGG 
CCGCAGCAGC GCATCATTGA CGAGTTCCGC AAGTACAACG GTCGCAGCGC CGACAACTAC 
GACGCGGACA AGGACAACTA CGCCATCGAG GTGCCCGAAG GCCGCAGCGC CCGCGCCGCA 
CTTGGCGAGA AGATGCGCGA GGTTTCGGCA AGGCAGTTCG GTGGTGACTA TTCCGGCGTT 
TCGGAAAGCG AACTGCTCGA CGCGCTGGTC TTCAACGTCT TCCCGAACTT CGCGCCGTGG 
GGCGGTTTCA TGCCCAATAT CGTCTATCGC TGGCGGCCCT GGCCCGATCA GGACAAGTGC 
CTGATGGAAG TGCGCGTGAT CGCCCGCGTC CCGGAAGGCC AGCCGCGCCC CGCCGGTGTG 
CCGATGCACA TGCTGGGCGA CGACCAGATC TGGGCCGATG CGCCCGAGCT TGGCGTGCTT 
GGCGCGGTGC TCGACCAGGA CAGCGAGAAC ATGGCGCTGT GCCACGAAGG CCTGAAGGTT 
TCCAAGAACC AGGCGGTGGA ACTGGCGGAC TATCAGGAAG TGCGCATCCG CCACATCCAC 
CAGACGCTCG ACAGCTATCT GAACGCGTGA

Protein sequence

MADRDPGAFD KARCPGTSWE DILRADEVQP PAFMAEDRSQ YLGSEPIDAA RYYSPEFFKT 
ECERMWPFVW QFAAREEDLP EPGDYVTYDN AGRSYLIVRQ EDGSLKAFHN VCLHRGRKLK 
TDSGSAEQFL CPFHGFSWNP DGSLRNIPCR WDFAHLSDQK MQLPEASLAQ WGGYVFVRDA 
AEGPTIEEYL DPLPEFFKRW KHEECVTVAW VAKVIPANWK IAMEAFMESY HAYVTHPQLM 
PFTGDANAAY HVLGRHVNVN YTPFGVVSPH IEAQAEAEHW PQQRIIDEFR KYNGRSADNY 
DADKDNYAIE VPEGRSARAA LGEKMREVSA RQFGGDYSGV SESELLDALV FNVFPNFAPW 
GGFMPNIVYR WRPWPDQDKC LMEVRVIARV PEGQPRPAGV PMHMLGDDQI WADAPELGVL 
GAVLDQDSEN MALCHEGLKV SKNQAVELAD YQEVRIRHIH QTLDSYLNA