Gene Saro_3539 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3539
Symbol
ID	5077688
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	+
Start bp	156111
End bp	157457
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	65%
IMG OID	640481263
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001165925
Protein GI	146275765
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCACCT ACATCCAGGT CCCCGAAACC GATGCCCCCT ACCCGACCGA TGCCCGCGCG 
CAGTTTCCCG CCGCGCGCGG CGATGCGATC ACCGGCGACC GCTACTGGTC GAAGGAATTC 
GCCGCGAAGG AATGGGAACA CATGTGGAAG CGCGTGTGGC ACGTCGGCGG GCGCACGGCG 
CAGCTTGAAG AGCCGGGCGA TTTCATCACC CACAACTTCA TGCGCCAGTC GGTGGTCATG 
GTCCGCCAGA AGGACGGCGG CATCCGCGCG TTCCACAACG TCTGCCGCCA TCGCGGCAAT 
CGCCTCGTCA CCGTGGAAGA AGGCGGTGTC GGCGAACACT TCACCTGCCC CTACCACGGC 
TGGAAGTGGA ACATAAACGG CGCGCTCGAC CATGTGCAGG ACGAGGAGGA TTTCCCCCAG 
GGCAGCCCTT GCGGCAAGCT GCGGATGAAG GAAGTCCCGT GCGAGACCTG GGGCGGCTTC 
GTTTTCTACA GCTTCGATCC CAACGCGGTG CCGCTGATGG AATATCTCGA TCCCATCCCG 
TCGCTGCTCG GCAACCGCGA TCTCGCCAAC TGGAAGCGCG TGGTGTGGCG GACGCTGCGG 
GTGAACACCA ACTGGAAGTT CGCGTCCGAC AACTTCAACG AGGCCTACCA CATCCCCGCC 
GTGCATCCGC AGTTCGAGGG GATGATCGAC GATCACTACT CGACCACCGT GTTCGAGATG 
TACCCCACCG GGCACAACCG CATGATCGAG AAGCTGCAGC CATCGAGCCG CTATCCCGAT 
GCCCAGCAGA TGAAGCCGCT GTGGGCGCAG GTGCTCAAGG AATGGGACCT CGATCCCGCC 
GAGTTCGAAG GACGCGCGCA GGAAGGCCGT CTGGCCCTGC AGCAGGCGCG GCGCAAGCTG 
GGGCCGGCAC GCGGATTCAC GCATTTCGCG GCACTGACCG ACGACGAGCT GACCGACCAG 
TTCCACCACA CCTGCTTCCC CAACCTGACG CTGACCGGCA CGCCTGAAGG GCTGCACGTG 
TTCCGCACCG AGCCGGACAT GGAAGACCCC AACTGGTCGA CCTTCGACTA CTGGTACCTT 
GCGCCGGAAG TCGCGGGCGG AGCGGATGTG CCGACGCTAT ATGGCCTGCG CCCGTGGAAG 
GAAGCCGAGC ACCAGACCGG CGACTTTACC GCCTACAGCG CCGAGATTCC GCAGGGCGAC 
TTCCTGATCC AGGACCTCGA CGTGGCGGTG ACGCAGCAGC AGGGGCTGCA CTCGCTCGGC 
CATGACGATG CCTACCTCGC CGGCCAGGAA ACGCGCGTGC GCAGGTTCCA CGAAGTGATC 
AACGACTACA TCGAGGGGCG GCGCTGA

Protein sequence

MATYIQVPET DAPYPTDARA QFPAARGDAI TGDRYWSKEF AAKEWEHMWK RVWHVGGRTA 
QLEEPGDFIT HNFMRQSVVM VRQKDGGIRA FHNVCRHRGN RLVTVEEGGV GEHFTCPYHG 
WKWNINGALD HVQDEEDFPQ GSPCGKLRMK EVPCETWGGF VFYSFDPNAV PLMEYLDPIP 
SLLGNRDLAN WKRVVWRTLR VNTNWKFASD NFNEAYHIPA VHPQFEGMID DHYSTTVFEM 
YPTGHNRMIE KLQPSSRYPD AQQMKPLWAQ VLKEWDLDPA EFEGRAQEGR LALQQARRKL 
GPARGFTHFA ALTDDELTDQ FHHTCFPNLT LTGTPEGLHV FRTEPDMEDP NWSTFDYWYL 
APEVAGGADV PTLYGLRPWK EAEHQTGDFT AYSAEIPQGD FLIQDLDVAV TQQQGLHSLG 
HDDAYLAGQE TRVRRFHEVI NDYIEGRR