Gene Saro_1648 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_1648
Symbol
ID	3918757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	1723704
End bp	1724894
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	64%
IMG OID	640444389
Product	cytochrome P450
Protein accession	YP_496922
Protein GI	87199665
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTACCG TGATCGAGCG GCCGCAATTC CGCTTCGACC CATATTCCCC GGCAATCGAC 
GCCGACCCGT TCCCCGCCTA CAAGGTGCTG CGCGACGAAT ACCCCTGCTT CTGGTCCGAG 
GAGGCCGGAA AGTGGGTGCT CTCGCGCTAT GACGACGTGC TTGCAGCGCT GCAGGACTGG 
CGGACCTATT CTTCCGCCAA GGGCAACCTC GTGGACGAGT TTCCCGGTCG CGCCGGCTCG 
ACGCTGGGAT CGAGTGATCC GCCGCGCCAT GACCGCCTGC GCGCCCTCAT CCAGTCGGCC 
GTGACCAAGC GTGCGCTTGA ACACATTATC GCACCAGCCC GGGCATCGGC CCAGGCGCAT 
CTGGCCGCGC TGGCGGACAA GCCGGTGTTC GACCTGGTGG GCGACTACAC GTCGAAGCTG 
ACGGTCGACC TCCTCTTCTA CCTTTTCGCC CTGCCGGACG AAGGCGCGCA GCAGGTGCGC 
GAGAACGCGG TGCTGATGGT CCAGACCGAT CCGGTCACGC GCCAGAAGAG CCCCGAACAT 
CTCGCGGCGT TCCATTGGAT GGCGGACTAC GCCGAAAAGC TGGTCGCCTC GCGCAAGGCG 
AACCCCGGCG ACGACCTCCT GTCCAGCTTC ATCACCGCCG AGATCGACGG GGAGAAGTTG 
CTCGACAAGG AAGTCCAGCT TACCGTCACC ACGCTGATCA TGGCGGGCAT CGAAAGCCTT 
TCGGGCTTCA TGGCAATGTT CGGCCTGAAC CTTGCCGACT ATCCCGAAGC GCGCAGCGCG 
CTGGTTGCCG ACCCTTCGCT GATCCCCGAT GCGATCGAGG AATCGTTGCG GTTCAACACT 
TCCGCCCAGC GATTCAAACG GACGTTGACG CGGGACGTGG AGCTTCACGG ACAGGTGATG 
AAGGCTGGCG ACGCGGTGAT CCTCGCCTAT GGATCAGCCA ATCGCGACGA GCGGATGTTC 
GAGAATCCGG ACGTCTACGA CATCACCCGC AAGCCGCGGC GCCACCTCGG CTTCGGCGGC 
GGTGTCCACG CCTGCCTTGG CTCGATGATC GGGCGCCTGG CGACGCAGAT CGCCTACGAG 
GAACTCCTGA AGGCGGTGCC CGATTTCCGG CGTGCCGACG CCCCGCTCGA CTGGGTGCCT 
TCATCCAACT TCCGCAGTCC GAAGTCGCTC ATGCTCGAAA AGAAGGCCTG A

Protein sequence

MATVIERPQF RFDPYSPAID ADPFPAYKVL RDEYPCFWSE EAGKWVLSRY DDVLAALQDW 
RTYSSAKGNL VDEFPGRAGS TLGSSDPPRH DRLRALIQSA VTKRALEHII APARASAQAH 
LAALADKPVF DLVGDYTSKL TVDLLFYLFA LPDEGAQQVR ENAVLMVQTD PVTRQKSPEH 
LAAFHWMADY AEKLVASRKA NPGDDLLSSF ITAEIDGEKL LDKEVQLTVT TLIMAGIESL 
SGFMAMFGLN LADYPEARSA LVADPSLIPD AIEESLRFNT SAQRFKRTLT RDVELHGQVM 
KAGDAVILAY GSANRDERMF ENPDVYDITR KPRRHLGFGG GVHACLGSMI GRLATQIAYE 
ELLKAVPDFR RADAPLDWVP SSNFRSPKSL MLEKKA