Gene Saro_0220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0220
Symbol
ID	3916208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	229503
End bp	230840
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	65%
IMG OID	640442945
Product	cytochrome P450
Protein accession	YP_495502
Protein GI	87198245
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACCC AGCTTGCGCC CGAAGTGCCG CAATTCACCT ACCATTCCTC GCCCACCGCG 
ACCGAAGCGT TCGCGGCCTG GCTGAAGGAC AATCCGCAGG CCATTCCGGC GCATTCCCAT 
CCCTGGGACG TCAGCCGCTC GGACATCTAT GTCGAGGATC GCTGGCAACC GATCTTTGCC 
GAGATGCGGG CGAAGGCGCC GGTCAATCGC GTGCCGGATT CGCCTTACGG GGCCTATTGG 
AACGTCGCCA GCCACAAGGC GATCATGCAC GTCGAATCGC TGCCCGAACT GTTCTCGTCT 
TCCTGGCAGT ACGGCGGCAT CACCATCGGC GACCCGCCGG AAGATGTCGA TCCGCAGAAG 
CTGGCCGAAC GGCAGCTTCC CATGTTCATC GCGATGGACC GGCCCGATCA CACCGGCCAG 
CGCCGCACCG TGGCCCCGGC CTTCACCCCG GCCAAGATGG TCGAGATGGA AGCCGAGATC 
CGCCGTCGCA CCGCAAGCGT GCTCGATTCG CTGCCGTGGG GCGAACGATT CGACTGGGTC 
GACAAGGTCT CGATCGAACT GACCACGGGC ATGCTCGCGA TCCTGTTCGG CTTCCCCTGG 
GCCGACCGCC GTCTCCTGAC CTTCTGGTCG GACTGGGCCG GCGACGTCGA GCTGACCCTC 
GCGCGCGAAC TTGCCGACAC GCGCTTTGGC TTCCTCGGAG AGATGGCGCA CTATTTCCAG 
CGCCTGTGGG GAGCGCGGAT GCAGGCGCCT CCTTCGGGCG ATCTCATCTC GATGATGATC 
CACTCCGAGG CGATGAACCA CATGAGCCCG CAGGAGTTCA TGGGCAATCT CGTGCTGCTG 
ATCGTCGGTG GCAACGACAC CACCCGCAAT ACCATGTCGG GCATCGTCCA CGCGCTCGAC 
AAGTTCCCCG ACCAGCGCGA ACTGCTGGAG CGCGATGCCT CGCTCATCCC CAACGCCGTG 
CAGGAATGCA TCCGCTACGT CACCCCGCTC GCGCACATGC GCCGCACGGC GACTGCCGAT 
ACCGAGCTTT TCGGCAACCA GATCAAGGCG GGCGAGAAGG TCATCCTGTG GTACATCTCG 
GCCAACCGCG ACGAGACCGT GTTCGAGAAT CCGGACAAGC TGATGGTCGA CCGGCCCAAT 
GCGCGACGTC ACCTGTCGTT CGGCCACGGC ATCCATCGCT GCGTCGGCGC GCGCCTTGCC 
GAACTGCAAC TGCGCATCCT GCTCGAGGAA ATGCACGAGC GGCGCATGCG CGTGCGCGTG 
GCGGGCGAGG TGGAGCGCGT GCGCGCCAAC TTCGTCCACG GCTTCCGCAA GCTGGAAGTG 
GAACTGGAGA AGCGCTAG

Protein sequence

MATQLAPEVP QFTYHSSPTA TEAFAAWLKD NPQAIPAHSH PWDVSRSDIY VEDRWQPIFA 
EMRAKAPVNR VPDSPYGAYW NVASHKAIMH VESLPELFSS SWQYGGITIG DPPEDVDPQK 
LAERQLPMFI AMDRPDHTGQ RRTVAPAFTP AKMVEMEAEI RRRTASVLDS LPWGERFDWV 
DKVSIELTTG MLAILFGFPW ADRRLLTFWS DWAGDVELTL ARELADTRFG FLGEMAHYFQ 
RLWGARMQAP PSGDLISMMI HSEAMNHMSP QEFMGNLVLL IVGGNDTTRN TMSGIVHALD 
KFPDQRELLE RDASLIPNAV QECIRYVTPL AHMRRTATAD TELFGNQIKA GEKVILWYIS 
ANRDETVFEN PDKLMVDRPN ARRHLSFGHG IHRCVGARLA ELQLRILLEE MHERRMRVRV 
AGEVERVRAN FVHGFRKLEV ELEKR