Gene Saro_3546 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3546
Symbol
ID	5077695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	+
Start bp	163147
End bp	164577
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	65%
IMG OID	640481270
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001165932
Protein GI	146275772
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGACA GTGATCCGAA CGTGGCCAAG GGTCATCAGG GCGGAAAGGC CCGCTGCGAA 
GCGATCAGCT GGCAGGAACT GCTGGCGCAG GATTCGCGCC CTGCCCCGGC GATGCTGACC 
GAGGAAAGCT ACCAGTATCG CGGGTCCGAG CCGCTCGCGG CCGAACGCTA TACCTCCGAA 
GATTTCGCCC GCCTCGAGCG CGAGCGGATG TGGCCGCATG TCTGGCAGTT TGCCGCGCGC 
GAGGAGGACA TTCCCGAAGC CGGCGACTAT ACCGTGTTCG AGAACGCGGG CCGTTCGTGG 
CTGATCTCGC GCCAGGAAGA CGGCAGCGTC AAGGCGATGC ACAACGTGTG CCTCCATCGC 
GGACGCAAGC TGCGCACCGA GGACGGGACG GCGGACACCT TCACCTGCCC GTTCCACGGC 
TTTGCCTGGA ACAAGGACGG CAGCTTTGCC GGAATGCCCT GTTCGTGGGA CTTCAAGCAC 
TTGTCGGCCG ACAAGATGGC GCTGCCCGAG GCCGAGGTCG GCCGTTGGGG CGGCTACATC 
TTCCTGCGCG AGGAAAAGGG CGGGCCGAGC CTCGAGGAAT ACCTCGCCCC CCTGCCCGAG 
TTCTTCAAGC GCTGGCGCCA CGAGGAATGC ACCACGGTGA TCTGGGTGGC CAAGGAAGTG 
CCGGCCAACT GGAAGGTGAC CGCCGAGGCG TTCATGGAAG CCTGGCACAC GGTCGTCACC 
CATCCGCAGC TCCTGCCCTT CACCGGCGAT GCCAACGCGG CTTACTGGAC CTATGGCGAC 
AACGTGAACG TCAACCACGT TCCGTTCGGC ATCATGAGCC CGCACGTCGA CCCGAACGGC 
AAGACGCAGC AGTGGATCGT CGACGAGTTC TGCAAGTACA ACGGGCGCAG CGCAGACAAC 
TACGAGGCAT CGGGCGATCC CTTCGCGGTG ACCGTGCCCG AGGGCATGAC GGCACGCGCC 
GCGCTGGGTG CGGCGATGCG CGCGGGCTAT ACCGCGCAGA CCGGCTATGA CCACGACCAT 
GCCACCGATG CCGAGCTGCT GGACGGCCTC GTCTACAACG TGTTCCCGAA CTTTGCGCCA 
TGGGGCGGGT TCATGCCGAA CATCGTCTAT CGCTGGCGCC CCGGAAAGAC GCCGGACACC 
TGCCTGATGG AAGTGCGCAT CCTGGCCCGC GTGAAGAAGG GCGACCCGAC GCCGCACGGC 
GTGCCGATGA AGCTGCTGAC GCCAGAACAG CGCTGGACCG ACGCGCCCGA GCTGGGCGTG 
CTGGGCCACG TTTTCGAGCA GGACATGGAC AACCTGCCCT ATGTGCAGGA CGGCCTCCAC 
GTATCCAAGA CCGGCGAGGT GAACCTGGGC GACTACCAGG AAATCCGCAT CCGCCAGTTC 
CACCAGACGC TGGACAAGTA CCTGAACGGC GAACTGGGGG CGAAGAAGTG A

Protein sequence

MADSDPNVAK GHQGGKARCE AISWQELLAQ DSRPAPAMLT EESYQYRGSE PLAAERYTSE 
DFARLERERM WPHVWQFAAR EEDIPEAGDY TVFENAGRSW LISRQEDGSV KAMHNVCLHR 
GRKLRTEDGT ADTFTCPFHG FAWNKDGSFA GMPCSWDFKH LSADKMALPE AEVGRWGGYI 
FLREEKGGPS LEEYLAPLPE FFKRWRHEEC TTVIWVAKEV PANWKVTAEA FMEAWHTVVT 
HPQLLPFTGD ANAAYWTYGD NVNVNHVPFG IMSPHVDPNG KTQQWIVDEF CKYNGRSADN 
YEASGDPFAV TVPEGMTARA ALGAAMRAGY TAQTGYDHDH ATDAELLDGL VYNVFPNFAP 
WGGFMPNIVY RWRPGKTPDT CLMEVRILAR VKKGDPTPHG VPMKLLTPEQ RWTDAPELGV 
LGHVFEQDMD NLPYVQDGLH VSKTGEVNLG DYQEIRIRQF HQTLDKYLNG ELGAKK