Gene Saro_3659 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3659
Symbol
ID	5077807
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	288676
End bp	290097
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	64%
IMG OID	640481382
Product	cytochrome P450
Protein accession	YP_001166044
Protein GI	146275884
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.539017
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAGAG CTGCGACTGC GGCCGGTAAT GGCCTTCCCT TGCTCGATGG AGGCGTGCCG 
CTCCTCGGGC ATCTCGCACA GTTCTTCCGC GATCCGGTTT CGGTACTCAA GCGCGGATAC 
CGCTCGAAGG GGCGGCTCTT CGCGATGAAC TTCATGGGCC AGCGCATGAA CGTGATGCTG 
GGTCCGGAAC ACAACCGCTT CTTCTTCGAG GAGACGGACA AGCTGCTCTC GATCCGGGAG 
TCGATGCCGT TCTTCCTCAA GATGTTCTCG CCCGAGTTCT ATTCGTTCGC GGAAATGGAC 
GAGTACCTGC GCCAGCGCTC GATCATCATG CCCCGCTTCA AGGCGGCATC GATGAAGCAG 
TACGTGCCGG TCATGGTCGA GGAATCGCTT AACCTGGTCG AGCGGCTGGG CGAGGAAGGC 
GAGTTCGACC TGATCCCGAC GCTGGGCCCG GTGGTAATGG ACATCGCCGC GCACAGCTTC 
ATGGGACGCG AGTTCCACGA GAAGCTGGGG CATGAGTTCT TCGAACTCTT CCGCGATTTT 
TCGGGAGGCA TGGAATTCGT CCTGCCGCTG TGGCTGCCGA CACCCAAGAT GGTCAAGTCA 
CAGCGCGCGA AGAGGAAGCT CCACGCCATC CTGCAATCGT GGATCGACAA GCGCCGCGCC 
GCCCCGCTCG ATCCGCCCGA TTTCTTCCAG ACGATGATCG AGACGAAGTA TCCCGATGGC 
CGCCCGGTGC CCGACGAGAT CATCCGCCAC CTGATCCTCC TTCTCGTCTG GGCAGGGCAC 
GAGACGACCG CCGGGCAGGT GAGCTGGGCG CTGGCGGACC TCCTTCAGAA CCCGGACTAC 
CAGAAGGTGC TGCGCGGCGA GATATCGTCG CTGCTGGGCG GCAGCGACGG GCGCGACCTT 
GGCTGGGAAC AGGCCGTGGC GATGGAGAAG ATGGACCTTG CCCTGCGCGA GACCGAGCGG 
CTCCATCCGG TCGCCTACAT GCTCAGCCGC AAGGCGCGGG CCGATATCGA GCGCGACGGC 
TATGTCATCC GCAAGGGCGA GTTCGTGCTG CTTGCGCCTT CGGTCAGCCA CCGCATGGAA 
GAGACGTTCC GCAATCCCGA TGCCTATGAC CCGGAACGCT TCAACCCGGC CAACCCCGAT 
GCGCAGATCG AAAGCAATTC GTTGATCGGC TTTGGCGGGG GTGTCCACCG CTGCGCGGGC 
GTGAACTTCG CGCGGATGGA GATGAAGGTG CTGGTGGCGA TCCTGCTCCA GAACTTCGAC 
ATGGAGCTGA TGGACGAAGT GCGGCCCATC GCGGGCGCAT CGACCTACTG GCCCGCCCAG 
CCCTGCCGGG TGCGCTATCG GCGGCGCAAG CTCGACGGGT CGGAGGCAGG TGCGGACATG 
GCGGCGCTGG CCCGAGCCGC CGGCTGCCCG GCGCATACGT GA

Protein sequence

MARAATAAGN GLPLLDGGVP LLGHLAQFFR DPVSVLKRGY RSKGRLFAMN FMGQRMNVML 
GPEHNRFFFE ETDKLLSIRE SMPFFLKMFS PEFYSFAEMD EYLRQRSIIM PRFKAASMKQ 
YVPVMVEESL NLVERLGEEG EFDLIPTLGP VVMDIAAHSF MGREFHEKLG HEFFELFRDF 
SGGMEFVLPL WLPTPKMVKS QRAKRKLHAI LQSWIDKRRA APLDPPDFFQ TMIETKYPDG 
RPVPDEIIRH LILLLVWAGH ETTAGQVSWA LADLLQNPDY QKVLRGEISS LLGGSDGRDL 
GWEQAVAMEK MDLALRETER LHPVAYMLSR KARADIERDG YVIRKGEFVL LAPSVSHRME 
ETFRNPDAYD PERFNPANPD AQIESNSLIG FGGGVHRCAG VNFARMEMKV LVAILLQNFD 
MELMDEVRPI AGASTYWPAQ PCRVRYRRRK LDGSEAGADM AALARAAGCP AHT