Gene Saro_2249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_2249
Symbol
ID	3916565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	2389017
End bp	2390207
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	67%
IMG OID	640445003
Product	cytochrome P450
Protein accession	YP_497520
Protein GI	87200263
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.274245
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATACCGG CACACGTTCC GGCCGACCGG GTGGTCGATT TCGACATCTT CAATCCGCCG 
GGCGTGGAAC AGGACTACTT CGCAGCCTGG AAGACCCTGC TCGATGGGCC GGGGCTGGTC 
TGGAGCACGG CCAACGGCGG GCACTGGATC GCCGCGCGTG GCGATGTGGT GCGCGAACTG 
TGGGGAGATG CGGAGCGGCT CTCCAGCCAG TGCCTTGCCG TTACGCCCGG CCTTGGCAAG 
GTCATGCAGT TCATCCCTCT CCAGCAGGAC GGGGCGGAGC ACAAGGCCTT CCGCACGCCG 
GTGATGAAGG GGCTCGCCTC GCGCTTCGTG GTGGCGCTCG AGCCGAAGGT CCAGGCGGTT 
GCGCGCAAAC TCATGGAAAG CCTGCGCCCG CGCGGATCGT GCGATTTCGT CAGCGATTTT 
GCCGAGATCC TGCCCCTCAA CATCTTTCTG ACGCTGATCG ACGTGCCGCT GGAAGACCGT 
CCGCGCCTGC GCCAGCTGGG CGTGCAGCTT ACCCGCCCCG ATGGCTCGAT GACGGTGGAG 
CAATTGAAGC AGGCCGCCGA CGACTACCTC TGGCCCTTCA TCGAGAAGCG GATGGCCCAG 
CCGGGCGACG ACCTGTTCAG CCGCATTCTC TCGGAACCGG TGGGCGGACG TCCGTGGACG 
GTCGACGAGG CGCGGCGGAT GTGCCGCAAC CTGCTGTTCG GCGGGCTTGA TACCGTGGCC 
GCAATGATCG GCATGGTCGC GCTGCATCTT GCACGCCATC CCGAGGACCA GCGGCTTCTG 
CGGGAAAGGC CAGACCTGAT CCCGGCGGCG GCCGACGAAC TGATGCGCCG CTACCCGACC 
GTTGCCGTCA GCCGCAACGC GGTGGCCGAT GTGGACGCCG ATGGCGTTAC CATCCGCAAG 
GGTGACCTCG TCTACCTGCC CAGCGTGCTG CACAACCTTG ATCCGGCGAG TTTCGAGGCG 
CCCGAGGAAG TGCGCTTCGA CCGGGGTCTC GCGCCGATCC GCCACACCAC GATGGGGGTG 
GGTGCGCATC GTTGCGTCGG GGCGGGACTG GCGCGGATGG AGGTGATCGT GTTCCTGCGC 
GAATGGCTTG GCGGAATGCC CGAATTCGCG CTGGCCCCGG ACAAGGCGGT GACGATGAAG 
GGGGGCAACG TCGGCGCTTG CACGGCGCTG CCTCTGGTCT GGCGGGCCTA G

Protein sequence

MIPAHVPADR VVDFDIFNPP GVEQDYFAAW KTLLDGPGLV WSTANGGHWI AARGDVVREL 
WGDAERLSSQ CLAVTPGLGK VMQFIPLQQD GAEHKAFRTP VMKGLASRFV VALEPKVQAV 
ARKLMESLRP RGSCDFVSDF AEILPLNIFL TLIDVPLEDR PRLRQLGVQL TRPDGSMTVE 
QLKQAADDYL WPFIEKRMAQ PGDDLFSRIL SEPVGGRPWT VDEARRMCRN LLFGGLDTVA 
AMIGMVALHL ARHPEDQRLL RERPDLIPAA ADELMRRYPT VAVSRNAVAD VDADGVTIRK 
GDLVYLPSVL HNLDPASFEA PEEVRFDRGL APIRHTTMGV GAHRCVGAGL ARMEVIVFLR 
EWLGGMPEFA LAPDKAVTMK GGNVGACTAL PLVWRA