Gene Saro_3337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3337
Symbol
ID	3915984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3559319
End bp	3560713
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	67%
IMG OID	640446122
Product	cytochrome P450
Protein accession	YP_498606
Protein GI	87201349
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCAGCA TCGCGCCTGA CAGCAGGACA GATCTACATA CCGAACGCGC CAACCCGCAC 
TGGGTAAGGC TGGGCGGGGA CCACAAGCTG GACCATGTCC CCGGCGAGGA CGGCTGGCCG 
GTGCTCGGCA CCACGCTGAT GCAACTGGCA GATCCGCTGG GGTTCCAGAG ACGCATGGTC 
GAGACCCACG GCCCGGTGTT CCGGACGCGC AGCTTCGGAC GGCGCGGAGT GAACCTTATC 
GGCGCGGACG CAAACGAACT GGTGCTGTTC GACCGCGACC GGCTGTTCTC CAACGAACAG 
GGCTGGGGAC CGGTACTCAA CCTGCTGTTC CCCCGGGGCC TGATGTTGAT GGACTTCGAG 
GCGCACCGGG TGGACCGCCG CGCGCTGTCC ATCGCTTTCA AGCCGGAGCC GATGCGCGCC 
TATTGCAGCG TGCTCAACAC AGGCATCGCG CAGGCCGTGC AAGGCTGGGG CGGCCAGATG 
CGGTTCTACG ACGCGATCAA GGCCCTGACG CTCGACACCG CCGCCTCCAG CTTCCTCGGC 
CTTCCGCTCG GGCCCGAGGC CGACCGGCTC AACAAGGCCT TCGTCGACAT GGTCCAGGCG 
TCGGGCGGGG TCGTTAGACG CCCTCTGCCC TTCACCAGGA TGGGCAAGGG CGTAGCGGGA 
CGGCGCCTGA TGGTCGAATA CTTCGGCCGG CTGGTGCGCG AGCGGCGCGC GGATCCCGGG 
CAGGACATGT TCAGCCAGTT CGCGCTCGCC ACGCGCGAGG ACGGCTCGCT CCTGCCCGAG 
GACGTGGTGG TCGACCACAT GATCTTTCTG ATGATGGCCG CTCACGACAC CATCACCAGT 
TCGGCCACGG TGCTGTTCTG GCAATTGGCC CGGAACCCCG ACTGGCAGGA CCGACTGCGC 
GCCGAAGCCC GCGCCGTGAC CGGGGGCGAC GGCCTTCCAC TGGCCTACGA GGACCTCGGC 
CGGATGGAAT TGACCGAGAT GGCGTTCAAG GAGGCGCTGC GCTTCATGCC GCCTGTGCCC 
AACATGCCGC GCCGCGCGCT GCGTGACTTC GAGTTCGGCG GCTACCGCAT CCCGGCAGGG 
ACGCCGGTGG GGATCAGCCC GGCGGCCGTC CACGCCGATC CTGCGCATTG GCCCGAACCG 
GACCGATTCG ATCCGCTACG ATTCACCCCG GAAAACGTCT CGGGACGCCA CAAGTATGCC 
TGGGTGCCCT TCGGCGGCGG CGCACACATG TGCCTCGGGC TGCATTTTGC CTATATGCAG 
GTGAAGTTGC TGGTCAGTCA CATCCTGACC CGCTACGAGG TCGCCATGCA GCCGGGCCCC 
GCGCCTTCGT GGCAGGCCTG GCCTATCCCG AAGCCCCGCG ATGGCCTGCG CGTGGAGATG 
CGCCGAATCT GTTGA

Protein sequence

MASIAPDSRT DLHTERANPH WVRLGGDHKL DHVPGEDGWP VLGTTLMQLA DPLGFQRRMV 
ETHGPVFRTR SFGRRGVNLI GADANELVLF DRDRLFSNEQ GWGPVLNLLF PRGLMLMDFE 
AHRVDRRALS IAFKPEPMRA YCSVLNTGIA QAVQGWGGQM RFYDAIKALT LDTAASSFLG 
LPLGPEADRL NKAFVDMVQA SGGVVRRPLP FTRMGKGVAG RRLMVEYFGR LVRERRADPG 
QDMFSQFALA TREDGSLLPE DVVVDHMIFL MMAAHDTITS SATVLFWQLA RNPDWQDRLR 
AEARAVTGGD GLPLAYEDLG RMELTEMAFK EALRFMPPVP NMPRRALRDF EFGGYRIPAG 
TPVGISPAAV HADPAHWPEP DRFDPLRFTP ENVSGRHKYA WVPFGGGAHM CLGLHFAYMQ 
VKLLVSHILT RYEVAMQPGP APSWQAWPIP KPRDGLRVEM RRIC