Gene Saro_3832 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3832
Symbol
ID	5077980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_009427
Strand	-
Start bp	486063
End bp	487253
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	65%
IMG OID	640481555
Product	cytochrome P450
Protein accession	YP_001166217
Protein GI	146276057
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0796027
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACCGCG CCATGACCAC GACCGTGCAA GATTTCGACC CCGAGGTTCC CGAAGACTTC 
GACAGCCCGC ATGCCGAATA TGCGCGCCTG CGCCGCGAGT GTCCCGTTGC GCATACCAAT 
GGCCTGGGCG GGTTCTGGGC GCTGACGCGC TATGAGGACG TCAAGCGCGC GGCTTCCGAT 
TCGACCACGT TCATCACTTC GGTGCAGAAC GTGGTGCCCA AGGTGGCATT TACCGGACGC 
CGCCCTCCGC TACATCTCGA TCCGCCCGAG CACACGCCCT ATCGCAAGGC GCTTAACCCG 
CTGCTCTCGC TCGAGCGTTC CGAAGCGTTT GCCGGAAAGG CGCGCGAGCT GACGCGCAAG 
CTTCTGGCAC CGATGGTGGA GAACGGCGGC GGCGACATCT GCGTCGAGCT TTCGAGCTAT 
CTGCCCGTCC ACGTCTTCGG CGAATGGATG CGCATGCCGG AGGAATGGCT CGACACGCTG 
CACGACGCGG GTCGCGCGTT CATTCTTGCG GTCCATTCGA ACACGCCGGA GCGGATGAAG 
GAAACGTCGC TGCGGCTCTA CGACATGGCG CGCGGCCTGA TCGCCGTTCG TCGGGAAAAC 
CCGCAGGATC CCGCGCTCGA TCCGACAAGC GCATTGCTTG CGGCCCGCCA CGAGGGCGAA 
CCTCTGCCCG AGGAACTGCT GGTGGGCACG GTGCGGCAGG TGCTGGTCGT GGGCATGGTC 
GCGCCGATGG TCATGATCGG CAACATCTGC GTCCACCTCT CGCGCGACAA GGCGCTGCAG 
CAGCAGCTTC GTGCCGATCC CTCGCTGGTG CCGGCGGCAA TCGAGGAATT CCTGCGGCTC 
TACACGCCCT ATCGCGGATT TGCCCGGACG GCGGTGTGCG ACGTGGATAT GGGCGGACGC 
ACGATCCCCA AGGACGAGGC GATCGCGCTG GTCTATGCAT CGGCAAACCG CGACGAGGAC 
GTGTTCCCGG ACGGCGACAA GTTCATCCTC AACCGCCCCA ACATCGCGCA GCACCTGGCT 
TTCGGTCGCG GGCCGCATAA TTGCCCCGGC GTGCATCTGG GACGGATGCA GCTTCGCGTG 
GCGCTGGAGG AAATCCTGGC CGCAACGCGC GAGTTCGAGC TTTCCGGGCC GGTAAGCGTG 
AGCCGCTGGC CCGAGGTCGG CGCGCTTTCG GTGCCGCTGC GCTTCGTTTG A

Protein sequence

MHRAMTTTVQ DFDPEVPEDF DSPHAEYARL RRECPVAHTN GLGGFWALTR YEDVKRAASD 
STTFITSVQN VVPKVAFTGR RPPLHLDPPE HTPYRKALNP LLSLERSEAF AGKARELTRK 
LLAPMVENGG GDICVELSSY LPVHVFGEWM RMPEEWLDTL HDAGRAFILA VHSNTPERMK 
ETSLRLYDMA RGLIAVRREN PQDPALDPTS ALLAARHEGE PLPEELLVGT VRQVLVVGMV 
APMVMIGNIC VHLSRDKALQ QQLRADPSLV PAAIEEFLRL YTPYRGFART AVCDVDMGGR 
TIPKDEAIAL VYASANRDED VFPDGDKFIL NRPNIAQHLA FGRGPHNCPG VHLGRMQLRV 
ALEEILAATR EFELSGPVSV SRWPEVGALS VPLRFV