Gene Saro_3505 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3505
Symbol
ID	5077654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	113750
End bp	115099
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	64%
IMG OID	640481229
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001165891
Protein GI	146275731
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.231372
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACCC TGCGTGAAGA CGTTCCGCCG CCGATGGACG GCCGCGATCC CTCGCACCTG 
CGCGGCGATG CCATTACCGG CGACCGCTAT TATTCGGCTG AATTCGCCCG GAAGGAATGG 
GACGGGCTGT GGACGCGCAT CTGGCACATT GCCGGGCGCA CCGCCGAAAT TCCCGAAGCG 
GGCGATTTCC TCGTCCATAC CTTCATGAAG GAATCGGTCA TTGCCGTGCG CCAGGACGAC 
GGTTCAGTCC GCGCCTTCTA CAATTCCTGC GGCCATCGCG GGATGCGCAT GGTCGACCAG 
TCGAGTTCGG TCGCCGCGTT CCATTGCCCC TACCACGGCT GGCGCTGGGG CATCGACGGC 
GTGCTCGAAC ACGCGCAGGA CGCCGACGTC GATTTCAAGC GTGGCAACCC CTGCGGCAAG 
CTGAAGCTCA AGGAACTGCG CTGCGGTACC TGGGGCGGCT TCGTCTGGTA CACCATGGCC 
GAGGAAGGCC CTTCGCTCGA GGAATACCTC GCGCCGATGC CCGCGCTGTA CAAGAATTAC 
CCGATGGATA CCGCGGTCCG GGTCGCGTGG TATCGCATCG AACTCAACGC CAACTGGAAG 
TTCGTCACCG ACAACTTCTC GGAAAGCTAT CACACCCGGA CCGCGCATCC CCAGGTCCCG 
CCGTGGATCG ACCAGGACGT CGATTCCGCC CGGCATGAGA TGTGGCCCGC CGGCCATGGG 
CGCACGGTCC AGCCGATGCG GCCCTCGCTG ACCGACCGGC CCGCCGATGG CACCGAACAC 
ATGTTCGCCC ACATCCTGCG CGCGTGGGAC ATCGATCCGG CAAAGTATTC CAGCTACGAG 
GAATTCGCGC TCCAGGGGTG GAAGGACCTG AAGCAGGCGA AGCGCCGCCT GTGGCGCGAG 
CGGGGTTATG TCCACTACGA GAACATGGAC GACGAGGAGA TCACCGACAG CCCGCACACG 
GTGATCTTCC CCAATGTCAC CATCAGCTTC CTGCCCGACA ATCTCATCCT TTTCCGCAGC 
GAACCGCACG CGACCGATCC CGAGAAGTGC TACTTCGACC TGTGGTGCAT GGCCTTCCCG 
GTCGAGGGGC AGAGCGAGGT GGAATCGATC ATGGCCGGGG TGCGCCCTCT GCGCGAGGTG 
GCGGAGTGCG AGCATCGGGT GTTCGATGGC GGGCGCGGCA TTCCCGAACT GGCCGGGCAG 
ATCGTCTACC AGGACATGGA ATTGGCCGAA AACATGCAGG CCGGCATGCA TTCTCGCGGA 
TATTCAGATG CCTACCTCTC GGACCAGGAG ACCCGCATCC GCTTCTTCCA CGAGGTGCTG 
AACGACTGGA TCGAGGGCCG GAAGGGCTGA

Protein sequence

MTTLREDVPP PMDGRDPSHL RGDAITGDRY YSAEFARKEW DGLWTRIWHI AGRTAEIPEA 
GDFLVHTFMK ESVIAVRQDD GSVRAFYNSC GHRGMRMVDQ SSSVAAFHCP YHGWRWGIDG 
VLEHAQDADV DFKRGNPCGK LKLKELRCGT WGGFVWYTMA EEGPSLEEYL APMPALYKNY 
PMDTAVRVAW YRIELNANWK FVTDNFSESY HTRTAHPQVP PWIDQDVDSA RHEMWPAGHG 
RTVQPMRPSL TDRPADGTEH MFAHILRAWD IDPAKYSSYE EFALQGWKDL KQAKRRLWRE 
RGYVHYENMD DEEITDSPHT VIFPNVTISF LPDNLILFRS EPHATDPEKC YFDLWCMAFP 
VEGQSEVESI MAGVRPLREV AECEHRVFDG GRGIPELAGQ IVYQDMELAE NMQAGMHSRG 
YSDAYLSDQE TRIRFFHEVL NDWIEGRKG