Gene Saro_3861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3861
Symbol
ID	5077472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009426
Strand	-
Start bp	28261
End bp	29541
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	62%
IMG OID	640480970
Product	Rieske (2Fe-2S) domain-containing protein
Protein accession	YP_001165632
Protein GI	146275471
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCCG AAACCATGCC CGTCGCCGCG GGGTCGGAGC CGACTGCGGT CGATTACGCA 
GTCTATCACA GCCAAGCGAT CTTCACTGCC GAACAGGAAA ACATCTTTCG CGGACAGACC 
TGGTGCTACC TCGGCCTCGA AGCCGAGCTG GCCAACAGCG GCGATTTCCG TTCGACCCAT 
GTCGGCAATA CTCCGGTGGT GGTGACGCGG GCAACCGATG GCACCATCCA TGCCTGGGTA 
AATCGCTGCG CCCACAAGGG CGCAACCGTG TGCCGCTCGC TGCGTGGCAA CCAGGCCGAC 
GGGGCGTTCG TCTGCGTCTA TCACCAGTGG GCCTACGACG CGACCGGTGC GCTTGTCGGC 
GTGCCGTTCC GGCGGGGGCT GAAAGGCGTG GGCGGCTATT CGAAGGAATT CAATATGGCC 
GAGCATTCGC TGGAGCGGTT GCGGGTCGAG ACATTCGGCG GCCTCGTGTT CGGCACCTTC 
AACTCGACCA TCGCCCCGCT CGACGACTTT CTGGGTCCAG TGATGCGCAA ATACATTCAG 
CGCGTCTTCC AGCGCCCGGT CAAGGTTCTG GGCTATGCGC GGCAGTTCAT GGCCGGCAAC 
TGGAAGCTCT ATTCGGAAAA CAGTCGTGAC AGCTACCACG GCGGTCTGTT GCACCTGTTC 
TATCCGACTT TCGGCATCTA CCGCCAGAGC CAGGAAAGCG CGGGTCTGGT TTCGGACGAG 
GGCTACCACA CCGTCTTTAC CGTGTCTAAG CCCAAGGGCG ATGTCGACTA CGGCTCGTTC 
GGTGACGAGG CCAACCGCGA GATGCAGGGT GAGGCCAAGT TGCAGGACGA GCGCCTGCTG 
GCATTCCGCC CGGAGATCGC TGATGATGTC GGACTGCACA TCCAGTCGAT CTTCCCGTCT 
GTCGTTGTCC AGCAGATCCA GAACACCCTC GCCACCAGGC AGATCGTGCC CCACGGGACC 
GACAAGACCG AGCTGGTCTG GACCTATTTC GGCTATGCCG ACGATGACGA TGAAACGACT 
CGCCACCGCC TTCGCAACCT CAACCTGGTT GGACCGTCTG GGTTGATTTC GATGGAAGAC 
GGCGAAGCGG TCGAACTGTG CCAGCAGGGC ACGATCGGTG CCGAAGGCAA GCGCAGCTTC 
GTCGAGATGG GCGGGGACGA TGTCCGACCG TCATACGCCC CGATGGGTAT GGATGAAAAT 
TCCGTGCGCG GGTTCTGGAA GGGCTATCTC GGGCTGATGG GCAATGCCTT GGCCGATCTC 
GCAGCGGAGG GCCGGGCATG A

Protein sequence

MNAETMPVAA GSEPTAVDYA VYHSQAIFTA EQENIFRGQT WCYLGLEAEL ANSGDFRSTH 
VGNTPVVVTR ATDGTIHAWV NRCAHKGATV CRSLRGNQAD GAFVCVYHQW AYDATGALVG 
VPFRRGLKGV GGYSKEFNMA EHSLERLRVE TFGGLVFGTF NSTIAPLDDF LGPVMRKYIQ 
RVFQRPVKVL GYARQFMAGN WKLYSENSRD SYHGGLLHLF YPTFGIYRQS QESAGLVSDE 
GYHTVFTVSK PKGDVDYGSF GDEANREMQG EAKLQDERLL AFRPEIADDV GLHIQSIFPS 
VVVQQIQNTL ATRQIVPHGT DKTELVWTYF GYADDDDETT RHRLRNLNLV GPSGLISMED 
GEAVELCQQG TIGAEGKRSF VEMGGDDVRP SYAPMGMDEN SVRGFWKGYL GLMGNALADL 
AAEGRA