Gene Saro_3536 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3536
Symbol
ID	5077685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	+
Start bp	153493
End bp	154827
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	65%
IMG OID	640481260
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001165922
Protein GI	146275762
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCAC AGGACAAGAT TTCCCGCTAC TCCCCGGAGT TCGACGTTGC CGTGCGCGGC 
GACACGATCA CCGCCGACCG CTACATCACG CGCGAGTGGA TGGAACTGGA GAACAAGCAC 
CTCTGGCCCA AGGTCTGGCA CCTTGGCGGC GTGCTGGCGG ACCTCGAGGA AGAGGGCGAT 
TTCATCCGCC ACAACTTCGG CAAGGAATCG GTCGTCATGG TCCGCCAGGC CGATGGCGGC 
GTGAAGGCGT TCTACAACAC CTGCCCGCAT CGCGGTAACC GCCTCGTCCT GGGCGACGTA 
GGTTCGGCCC CGCGCCTTAC CTGCGGCTAT CACGGCTGGC AGTTCGATCC CGACGGCACA 
CTGGTCCACG TGCAGGACCC GGACGATTTC GCCGGTGGCA ACCCCTGCGG CAAGGTCACG 
CTGTCCGAAC TGCGCTGCGA CACCTGGGGC CCGTTCGTGT TCTGGTGCAT GGACGACGAC 
GTCGCCCCGC TGCACGAATG GCTGTGGCCC TATACCGAGC GCCTTGCCGG CTACAAGCTC 
GACAACTGGG TGCGCGTGCT CAACGTCTCG GCGGACTGCG ACTTCAACTG GAAGATCATC 
CGCGACAACT TCAACGAGAG CTACCACCTC CCCACGATCC ACCCCGAACT CGCCACCTTC 
ATCAACGATG GCCTGCCGAC CACCGTGTTC GAGATGTACG AGAACGGCCA CAACGCAATG 
TGGATGATCG GCCACCAGGC CACCAGCCGC AAGGACTACG TCAGTGGCGA CGTGCCACCG 
GGCCTCTACG AAGCGGCGGA AGCCTGGGGC ATCGATCCCA AGGAATATCG CGGCCGCACC 
GCCGATATCC GCGAGGCCGT GATCAAGGCC AAGCGCGAAC GCGGCGCCGA AGCCGGCTAT 
GACTACAGCA CGATGACCGA CCAGCAGCTC GTGGACTACT TCCACTGCAC GCTGTTCCCC 
AACCTGACGA TCACCATGTC GCCCGAACAG TGCCAGATCC TGCGCACCGA ACCGCATCCG 
ACGGACCCGG AGAAGTGCGT GTTCCAGCAC TGGTGCCTCT ATCCGCCCAA CGCGAAGATG 
GCCGAGGTCG TCACCCCCGT GGGGCCGGCG CCGCTGCGGC ACGACGCGAT CCATCGCCAC 
TCGGTCTATG GCGACGGCGT CTCGCTGGGC TTCGTGGCCG ACCAGGACCT GTCCATCGGT 
ACCACCCAGC AACAGGGCCT CAACTCGCGC GGCTTCAAGG GCTGCCTGCT TCCGGGCCAG 
GAAAAGCGCG TGCAGCGCTT CCACGAGAAG CTGAACGACA TGGTTCTGGG CCACCCGACC 
AAGGCGCGGG AATAG

Protein sequence

MTAQDKISRY SPEFDVAVRG DTITADRYIT REWMELENKH LWPKVWHLGG VLADLEEEGD 
FIRHNFGKES VVMVRQADGG VKAFYNTCPH RGNRLVLGDV GSAPRLTCGY HGWQFDPDGT 
LVHVQDPDDF AGGNPCGKVT LSELRCDTWG PFVFWCMDDD VAPLHEWLWP YTERLAGYKL 
DNWVRVLNVS ADCDFNWKII RDNFNESYHL PTIHPELATF INDGLPTTVF EMYENGHNAM 
WMIGHQATSR KDYVSGDVPP GLYEAAEAWG IDPKEYRGRT ADIREAVIKA KRERGAEAGY 
DYSTMTDQQL VDYFHCTLFP NLTITMSPEQ CQILRTEPHP TDPEKCVFQH WCLYPPNAKM 
AEVVTPVGPA PLRHDAIHRH SVYGDGVSLG FVADQDLSIG TTQQQGLNSR GFKGCLLPGQ 
EKRVQRFHEK LNDMVLGHPT KARE