Gene Sare_1260 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1260
Symbol
ID	5703488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1457669
End bp	1458934
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	66%
IMG OID	641270775
Product	cytochrome P450
Protein accession	YP_001536156
Protein GI	159036903
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000262244
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGACGATCG AGACGACGGA AACTCCGCCC GCCGACGACT CACTTCGGGC GCCGCTTCCT 
CGGCAGTTCA TGCAGCGCGA CGATCCGTCG AAGCTGCCGC CGGCGCTGGC GGCGTTGGCC 
GAGCAGTCAC CGGTCGGCAG GTCGACGCTG CCCGACGGGG ATCCGTTCTG GATGGTGTCC 
GGGTACGACG AGGCCCGCGC GGTCCTGTCG GATCCACGGT TTTCCTCCGA CCGGTTTCGT 
TACCACCCCA GGTTCAAGAA ACTCTCCGGT CAGCTTGGCG AGCGGCTACG AAACGACAAG 
GCCCGGGCCG GATCGTTCAT CAACATGGAT CCACCTGAGC ACACCCGCTA CCGTAAGTTA 
CTCACCGGCC AGTTCACCGT ACGGAGAATG CGCCAACTCA CCGTCCGGAT CGAGCAGATC 
GTCACCGAGC AGGTGGATGT GATGCTGGCG GAGGGAAACA GCGCCGACCT CGTTTCGGCG 
TTCGCGGTTC CGGTGCCCTC GTTGATGATC TGCGAGCTGC TGGGGGTGCG CTACGAGGAT 
CGTACGGAGT TCCAGCGCCG CGCGGCGGGC CTGCTGCAGA CGGATTTGCC GATCAAACAG 
GCGGTGGAAA ACCTCGAAGC TCAGCGCGCG TTCATGCAGC GGCTGGTGAC GGACAAGCGG 
AGGACTCCCG CGGACGACAT GATCTCCGGT CTGGTGCACC ACGCGGGTGC TGAACCCCCA 
TTGACCGACG ACGAGCTGGT CGGCATCGCT ACCCTGTTGC TCTTCGCCGG CCTCGACACC 
ACCGCGAGCA TGCTGGGGCT CGGCATGTTC ATGCTGTTGC AGCGGCCCGA GCAAATGGCT 
GTGCTGCGCG ACGACCCGTC CCGGATCGGG GACGCCGTCG AGGAGTTGCT GCGCTACCTG 
ACTGTCGTCA GCACCGGGCT CTTCCGGTTC GCCAAGGAGG ACGTGGTGCT CGGTGACGAG 
CACATCCCGG CCGGGTCGAC AGTGGTGGTC TCCCTGATGG CCGCGAACCG CGACGGGCGG 
CACTGGCCGG AGCCAGAGAC GCTGGACGTG ACCCGGGTGC GGAGCTCGCA CCTGGCGTTC 
GGCCACGGCG TGCACCAGTG TCTCGGTCAG CAGTTGGCGC GGATCGAGTT GACGGTCGGC 
ATCACCGAGC TGCTGCGTCG CCTGCCCAAC GTCCGGCTCG CCGTACCACC CGCAGACGTG 
CCACTGCGCA ATGACATGAT CACTTATGGC GTGCACCGTC TGCCGATCCT GTGGGACACG 
CCGTGA

Protein sequence

MTIETTETPP ADDSLRAPLP RQFMQRDDPS KLPPALAALA EQSPVGRSTL PDGDPFWMVS 
GYDEARAVLS DPRFSSDRFR YHPRFKKLSG QLGERLRNDK ARAGSFINMD PPEHTRYRKL 
LTGQFTVRRM RQLTVRIEQI VTEQVDVMLA EGNSADLVSA FAVPVPSLMI CELLGVRYED 
RTEFQRRAAG LLQTDLPIKQ AVENLEAQRA FMQRLVTDKR RTPADDMISG LVHHAGAEPP 
LTDDELVGIA TLLLFAGLDT TASMLGLGMF MLLQRPEQMA VLRDDPSRIG DAVEELLRYL 
TVVSTGLFRF AKEDVVLGDE HIPAGSTVVV SLMAANRDGR HWPEPETLDV TRVRSSHLAF 
GHGVHQCLGQ QLARIELTVG ITELLRRLPN VRLAVPPADV PLRNDMITYG VHRLPILWDT 
P