Gene Saro_3533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3533
Symbol
ID	5077682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	+
Start bp	150238
End bp	151434
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	67%
IMG OID	640481257
Product	cytochrome P450
Protein accession	YP_001165919
Protein GI	146275759
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGCGC CCGCTCACGT ACCCGCCGAC CGCGTCGTCG ATATCGACAT CTACATGCCG 
CCCGGCCTTG CAGAACACGG GTTCCACAAG GCGTGGAGCG ATCTGTCGGC CGGCAATCCC 
GCCGTCGTCT GGACGCCCCG CAACGAGGGA CACTGGATCG CGCTGGGTGG CGAGGCCCTG 
CAGGAAGTCC AGTCGGACCC CGAACGCTTC TCCTCGCGCA TCATCGTCCT GCCCAAGTCA 
GTGGGCGAGA TGCACGGCCT GATCCCCACC ACCATCGACC CGCCCGAGCA CCGCCCGTAC 
CGTCAGCTCC TCAACGCGCA TCTCAATCCC GGTGCGATAC GCGGGCTTTC CGAGAGCATC 
CGCCAGACCG CGGTGGACCT GATCGAGGGC TTCGCGGCGC AAGGGCACTG CAACTTCACC 
GCCCAGTATG CCGAGCAGTT CCCGATCCGG GTGTTCATGG CGCTCGTCGG CATCGAAGCA 
TCCGAGGCGC CCAGGATACG CCACTGGGCC GAATGCATGA CCCGCCCCGG CATGGACATG 
ACTTTCGACG AGGCCAAGGC GGTCTTCTTC GATTACGTCG GCCCACTGGT CGATGCCCGG 
CGCGAGACGC CGGGCGAGGA CATGATCAGC GCGATGATAA ACGCCGACCT CGGAGATGGA 
CGCCGCCTCA CCCGTGACGA AGCGCTGTCC GTCGTCACGC AGGTGCTGAT CGCGGGGCTC 
GATACCGTGG TCAACGTGCT CGGCTTCATC ATGCGCGAGC TGGCCGGGAA CCCCGCCCTG 
CGGGCCGATC TCCGGCAGCG CGGCGCGGAC ATCCTGCCCG TCGTCCATGA ACTGTTCCGC 
CGCTTCGGCC TTGTCTCCAT CGCCCGCGAG GTGCGCCGCG ACATCGAGTT CCACGGCGTT 
CACCTGAAGG CCGGCGACAT GATCGCCATC CCGACCCAGG TTCATGGTCT CGACCCGCGC 
GTGAACCCCG ATCCTCTCGC CATCGATCCG TCGCGCAAGC GCGCGCGCCA TTCCACTTTC 
GGCTCCGGCC CGCACATGTG CCCGGGCCAG GAACTCGCGC GCAAGGAGGT GGCGATCACG 
CTCGAGGAAT GGCTGCGCCG CATCCCCGAT TTCGCGCTCG GGCCGAACTC GGACCTCTCG 
CCCGTGCCCG GAATCGTCGG CGCCCTGCGC CGCGTGGAAC TGGTCTGGAA TACCTAG

Protein sequence

MEAPAHVPAD RVVDIDIYMP PGLAEHGFHK AWSDLSAGNP AVVWTPRNEG HWIALGGEAL 
QEVQSDPERF SSRIIVLPKS VGEMHGLIPT TIDPPEHRPY RQLLNAHLNP GAIRGLSESI 
RQTAVDLIEG FAAQGHCNFT AQYAEQFPIR VFMALVGIEA SEAPRIRHWA ECMTRPGMDM 
TFDEAKAVFF DYVGPLVDAR RETPGEDMIS AMINADLGDG RRLTRDEALS VVTQVLIAGL 
DTVVNVLGFI MRELAGNPAL RADLRQRGAD ILPVVHELFR RFGLVSIARE VRRDIEFHGV 
HLKAGDMIAI PTQVHGLDPR VNPDPLAIDP SRKRARHSTF GSGPHMCPGQ ELARKEVAIT 
LEEWLRRIPD FALGPNSDLS PVPGIVGALR RVELVWNT