Gene Sare_2024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2024
Symbol
ID	5704461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2314564
End bp	2315838
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	70%
IMG OID	641271514
Product	cytochrome P450
Protein accession	YP_001536885
Protein GI	159037632
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00720801
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0287993
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGGT ACCAGGACCG GCCGACCGGC GACCAGCCCG GCGCTCCGGT GCCGTCAGGG 
TCGACCGATC CGGGCATCGG CGCGTTTCCG CTGCCCCGGC GCTGCCCCTT CAGCCCACCT 
GCCGAGTACG CCCGACTACG CGCCGAGCAT CCGGTCGTCC GACTGCCGAT GCTCGGCGGT 
GACACGGCCT GGGTGGTCTC CCGGCATGCC GACGTCCGGC AAGTGCTCAG CGATCCCCGG 
ATGAGCGCGG ACCGACGTCG ACCCGGTTTC CCGAAGTTCG CGCCGACGAC GGAGGGCCAG 
CGGCAGGCGT CGTTCGCGAA CTTCCGCCCA CCGTTGAACT GGCTGGACCC GCCGGAGCAC 
GCCATCTGTC GGCGACAGAT CGTCGACGAG TTCTCCGTGC GCCGGGTCCG GCAGTCACGG 
GCGTTGGTCG AACGGGTCGT CGACACGCAC CTCGACGCGT TGACCGCCGC CGCGCCCGGC 
GCCGACCTGG TGTCGACGTT CGCCTACCCG GTCCCATCAC AGGTGATCTG TGAGGTACTC 
GGCGTGCCCT ACGGCGAGCA CGAGTTCTTC GAGCGCCGTT CGACGCTGAT GTTCCGCCGG 
AGCACGCCGG CCGACGAACG CGCCCGCTGC GCCCGGGAGA TCCGCGATTT TCTCGACGTG 
GTGGTCACCG ACAAGGAGCG CCGTCCCGGC GACGACGTGC TCAGCCGGCT GCTGTACCGG 
CAGCGCCGCG CCGGTGGCGT GGACCACGAG GCCGTGGTGA GCATGGCCTT CGTGCTGCTG 
GTCGCCGGGC ATGTCACCAC GTCCAATATG CTCGCGTTGA GCGTGCTGGC CCTGCTCACT 
CATCCGGCAC GGCTGGCCCG GCTACGCGCC GAACCGGAAC GGTTCCCGGC CGCCGTGGAG 
GAACTGCTGC GGTACTTCAC CGTGGTCGAG GCGGCGACAG CCCGCACCAC CACCGCCGAG 
GTCACGATCG GCGGGGTGAC CATCGCGGCG GGAGAGGGGG TGGTGGCGCT GGGGCAGGCG 
GCGAACCGTG ATCCGAGGGT GTTCGAACAC CCCGACGAGT TCGACCCCGA CCGGGACGCC 
CGTGCGCACC TCGCCTTCGG CCACGGCCGG CACATCTGCC CGGGTCAGCA TCTCGCTCGG 
TTGGAGATGG AGGTCGCGCT CAGTCGCCTG TTCCGGCGGC TGCCCGGCCT AAGACTCACG 
ATGGAGGTTT CCGACCTGCC CCTCAAGGAG GACAGCAACA TCTTCGGGTT GTACGCCCTA 
CCGGTCGCCT GGTGA

Protein sequence

MTGYQDRPTG DQPGAPVPSG STDPGIGAFP LPRRCPFSPP AEYARLRAEH PVVRLPMLGG 
DTAWVVSRHA DVRQVLSDPR MSADRRRPGF PKFAPTTEGQ RQASFANFRP PLNWLDPPEH 
AICRRQIVDE FSVRRVRQSR ALVERVVDTH LDALTAAAPG ADLVSTFAYP VPSQVICEVL 
GVPYGEHEFF ERRSTLMFRR STPADERARC AREIRDFLDV VVTDKERRPG DDVLSRLLYR 
QRRAGGVDHE AVVSMAFVLL VAGHVTTSNM LALSVLALLT HPARLARLRA EPERFPAAVE 
ELLRYFTVVE AATARTTTAE VTIGGVTIAA GEGVVALGQA ANRDPRVFEH PDEFDPDRDA 
RAHLAFGHGR HICPGQHLAR LEMEVALSRL FRRLPGLRLT MEVSDLPLKE DSNIFGLYAL 
PVAW