Gene Saro_0514 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0514
Symbol
ID	3918644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	555434
End bp	556699
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	62%
IMG OID	640443244
Product	cytochrome P450
Protein accession	YP_495795
Protein GI	87198538
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGCCC AAACTTCTAC GGCGACCCAG AAGCATCGCG TTGCTCCGCC GCCACACGTG 
CCGGGCCATC TGATCCGGGA GATCGACGCA TACGACCTGG ACGGCCTGGA GCAGGGTTTC 
CACGAAGCAT GGAAGCGGGT GCAGCAACCC GATACGCCGC CGCTCGTCTG GACGCCGTTC 
ACTGGCGGGC ACTGGATCGC AACCCGCGGT ACCTTGATCG ACGAGATCTA TCGCAGCCCC 
GAACGCTTCT CCAGCCGCGT GATCTGGGTC CCGCGCGAAG CGGGCGAGGC GTACGACATG 
GTGCCGACCA AGCTCGATCC GCCCGAGCAT ACACCCTATC GCAAGGCGAT CGACAAGGGC 
CTGAACCTTG CGGAAATCCG CAAGCTCGAG GACCAGATCC GGACCATCGC GGTCGAGATC 
ATCGAAGGCT TCGCCGATCG CGGCCATTGT GAGTTCGGCA GCGAGTTCTC GACGGTGTTT 
CCAGTCAGGG TGTTTCTCGC GCTGGCCGGG CTGCCGGTTG AAGATGCCAC GAAGCTTGGC 
CTTCTGGCGA ACGAGATGAC GCGGCCCTCG GGCAACACGC CGGAAGAGCA GGGGCGGTCG 
CTGGAAGCGG CAAACAAGGG ATTTTTCGAG TACGTCGCGC CGATCATCGC TGCGCGCAGG 
GGAGGCAGTG GTACTGACCT CATCACGCGC ATTCTCAACG TCGAAATCGA CGGCAAGCCG 
ATGCCCGACG ACCGTGCGCT AGGCCTGGTT TCGCTCCTGC TGCTCGGAGG GCTCGACACT 
GTCGTCAACT TCCTCGGCTT CATGATGATC TACCTTTCCC GGCACCCCGA AACGGTTGCC 
GAAATGCGGC GCGAACCATT GAAGCTGCAA CGCGGCGTTG AAGAGCTGTT CCGTCGCTTC 
GCGGTCGTTT CGGATGCACG ATATGTCGTT TCGGACATGG AGTTCCATGG CACCATGCTT 
AAGGAGGGCG ACCTCATCCT CCTGCCAACG GCTCTGCACG GGCTTGACGA CAGGCATCAT 
GACGATCCCA TGACCGTCGA CCTGTCGCGG CGCGATGTCA CTCACTCGAC TTTCGCCCAG 
GGGCCGCACC GCTGCGCGGG CATGCACCTC GCGCGCCTCG AGGTGACGGT CATGCTGCAG 
GAATGGCTGG CCCGCATTCC GGAATTCAGG CTGAAGGACA GGGCAGTGCC AATCTACCAT 
TCAGGCATCG TCGCGGCGGT CGAGAACATT CCACTGGAAT GGGAGCCTCA GAGGGTTTCG 
GCATGA

Protein sequence

MNAQTSTATQ KHRVAPPPHV PGHLIREIDA YDLDGLEQGF HEAWKRVQQP DTPPLVWTPF 
TGGHWIATRG TLIDEIYRSP ERFSSRVIWV PREAGEAYDM VPTKLDPPEH TPYRKAIDKG 
LNLAEIRKLE DQIRTIAVEI IEGFADRGHC EFGSEFSTVF PVRVFLALAG LPVEDATKLG 
LLANEMTRPS GNTPEEQGRS LEAANKGFFE YVAPIIAARR GGSGTDLITR ILNVEIDGKP 
MPDDRALGLV SLLLLGGLDT VVNFLGFMMI YLSRHPETVA EMRREPLKLQ RGVEELFRRF 
AVVSDARYVV SDMEFHGTML KEGDLILLPT ALHGLDDRHH DDPMTVDLSR RDVTHSTFAQ 
GPHRCAGMHL ARLEVTVMLQ EWLARIPEFR LKDRAVPIYH SGIVAAVENI PLEWEPQRVS 
A