Gene Saro_1672 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1672
Symbol
ID	3918781
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	1752855
End bp	1754036
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	64%
IMG OID	640444413
Product	Rieske (2Fe-2S) protein
Protein accession	YP_496946
Protein GI	87199689
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0251995
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGATC TTTCCGGCGC GTTCCGGCAC ATTTCATCGG ACGAGGTCGA TCCGGACGCG 
GACTGGAGCC TGCCTGGCTG GCTCTACACC GATCCGGAAT ACTTCGCGGT GGAGATGGAG 
CGCGTGATCC GCCCGTCGTG GCAGATCGTC TGCCACGAAA GCGACATTGC CGCGTCAGGC 
GCGTACCGCA CGCTGGATTA TCTGGGTGAA AGCGTGATCG CGATCCGGGG TGAAGACGGC 
GCGATCCGTG CTTTCGCCAA CGTCTGCCGC CACCGTGCGA TGCGGCTGGT CGAAGGGCCT 
GCGGGCTGCG CCAAGAAGCT CGTCTGCCCG TATCATGCCT GGACGTTCGA ACCGGACGGT 
CGACTTTCGG GCGTGCCGAT GAAGTCCGAT TATCCCGCGC TAAAACTCGA AGAGAACGGC 
CTCGCGCCGG TCGCGGTCGA GATCTGGCGT GGCTTCGTGT TCGTGCGTCT GGTCGACGGC 
GGATTCCCCA GCGTGGCCGA GATGATGGCG CCGTTCGAGG AAGAGGTTGC GCCCTATCGC 
TTCGAGGACA TGCGCCGCAT TGGCGACGTG CGTTTGCGGA CGCGCGACGT GAACTGGAAG 
AACGTTGGCG ACAATTATTC CGACAACCTC CACATCCCCG TCGCGCACGA TGGCCTGACG 
CGCATCTTCG GCAAGTCCTA CGAGATTTCC GACCACGGTT GGGCCGATCG CATGAAGGGC 
GATCTGGTCG ACAAGCCTTC GGCCAACTTC TGGGAGCGGT TCTACCAGGC GCACCTGCCG 
GAGGTGCCGC ACCTGCCGGC GCAGTCGCAG CGGCGCTGGC TGTACTACAA GCTCTGGCCG 
AACATCGCGT TCGACATCTA TGCCGACCAG ATCGACTTCA TGCAGTGGCT GCCACTCACG 
CCGACGACCT CGGTCCTGCG CGAGATGTGC TTCGCGCTGC CCGATGAAAG GCGCGAGATG 
AAGCTGGTCC GCTATGCCAA CTGGCGGATC AATCGCGTGG TCAACAAGGA GGACACCTGG 
CTGATCGAGC GCATCCAGCA GGGCATGGCC TCGCAAAGTT ATGGCGCGGG ACCGATCGGC 
AAGAGCGAGG TCTGCCTGCG CAGCTTCGCG CGCAAGATTC GCGCAATCAC CCCCGAGGCC 
CGCCTGCACA AGGCGCCGGC GCCGGGGTGG AGCAGGAAAT AG

Protein sequence

MGDLSGAFRH ISSDEVDPDA DWSLPGWLYT DPEYFAVEME RVIRPSWQIV CHESDIAASG 
AYRTLDYLGE SVIAIRGEDG AIRAFANVCR HRAMRLVEGP AGCAKKLVCP YHAWTFEPDG 
RLSGVPMKSD YPALKLEENG LAPVAVEIWR GFVFVRLVDG GFPSVAEMMA PFEEEVAPYR 
FEDMRRIGDV RLRTRDVNWK NVGDNYSDNL HIPVAHDGLT RIFGKSYEIS DHGWADRMKG 
DLVDKPSANF WERFYQAHLP EVPHLPAQSQ RRWLYYKLWP NIAFDIYADQ IDFMQWLPLT 
PTTSVLREMC FALPDERREM KLVRYANWRI NRVVNKEDTW LIERIQQGMA SQSYGAGPIG 
KSEVCLRSFA RKIRAITPEA RLHKAPAPGW SRK