Gene Sare_1259 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1259
Symbol
ID	5703487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1456076
End bp	1457344
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	68%
IMG OID	641270774
Product	cytochrome P450
Protein accession	YP_001536155
Protein GI	159036902
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.0000310124
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCACCA CTGCCGAGAC TTCGGCCGAG ACGATCGACC TGTTCTCACC AGAAGTGGTC 
GCCGACCCAT TCGGCTGGTA CGCACGGCTG CGCGAAGAAA CGGGCCCAAC CACCGGGACG 
CTGAACATCG GCACCATGAT GGGCGGGCCC GAGATGTGGC TCGTCACTCG TTACGAGGAC 
GTACGCCAGG TCCTCACCGA TCCGCGGTTC CTCACCAACC CGCCCGCTGA CTCGCCCCTG 
GAGGACATCC GCGCCGGCGT GTTCAAGCGA CTGGACTTCC CGCCGGACCT GATCCCGTGG 
ATGGCCAACC TGCTCAACGT ATCCGACGGT GAGGACCACA CCCGGCTGCG CAAGCTGGTG 
TCGTATGCGC TGACCGCGCA CCGGATCGGC AAGCTGCGTC CCCGGGTCGA GAAGATCACC 
GCGGACCTCC TGGACAAGCT GGCCGAGGAC GGCAAGGACG GATCGCCGGT CGACCTCGTC 
GAGGAATACT GCTATCCGCT GCCGGTCACC GTGATCTGCG AGCTGGTCGG CATCGACGAG 
CCCGACCGGC CGCACTGGCG TGCCTGGGGC GACTCGATGG CCACGATGAA CGGCGAGCGC 
ATTCCGACCA CCCTGGTCAA GTGCATCGAG CTTGCCCGGG AGCTGATCGC GAAGAGGCGC 
GCCGAGCCTC AGGACGACCT CGTCACCGCG CTCGTGCAGG CGCAGGCCGA GGACCAGAAC 
CGGGTCTCCG ACGACGAGAT CATCGGCATC CTGTTCAGCC TGGTGACCGC CGGCCACCAG 
ACCACGACGT ACCTGATCGG GAACTCGGTC ATCCTCCTGC TGGAGAACCC CGACCAGCTC 
GCGCGGCTGA AGGAGAACCC TTCGATGTGG CCGCAGGCGG TGCGCGAGCT GCAGCGCCTG 
GGCCCGATCC AGTTCGCGCA GCCGCGGTTC CCCTCGGAGG ACATCGAGCT TGGTGGTGTG 
ACGATCCCGA GGGGGGCACC GGTGGCGCCG CTGCTGTTGG CCGCCAACAC CGACCCGCGC 
AGGTTCCCCG ACCCCAACAA GCTGATCATC GACCGGTTGG CCGTCGGCAG CGAGGGTCAC 
CTCGGGTTCG GCAAGGGCAT CCACCGCTGC CTCGGCCAGC ATCTCGCCTA CCAGGAGGCG 
GAGGTGGCGC TGCAGGGGCT GTTCACCCGG TTCCCGGACC TCTCCCTCGC CGTACCGCGC 
GAGGAGATCC CGTGGATCCT GCGCCCCGGC TTCACCCGGA CCAGGACCCT CCCGCTGAAG 
CTCGTCTGA

Protein sequence

MTTTAETSAE TIDLFSPEVV ADPFGWYARL REETGPTTGT LNIGTMMGGP EMWLVTRYED 
VRQVLTDPRF LTNPPADSPL EDIRAGVFKR LDFPPDLIPW MANLLNVSDG EDHTRLRKLV 
SYALTAHRIG KLRPRVEKIT ADLLDKLAED GKDGSPVDLV EEYCYPLPVT VICELVGIDE 
PDRPHWRAWG DSMATMNGER IPTTLVKCIE LARELIAKRR AEPQDDLVTA LVQAQAEDQN 
RVSDDEIIGI LFSLVTAGHQ TTTYLIGNSV ILLLENPDQL ARLKENPSMW PQAVRELQRL 
GPIQFAQPRF PSEDIELGGV TIPRGAPVAP LLLAANTDPR RFPDPNKLII DRLAVGSEGH 
LGFGKGIHRC LGQHLAYQEA EVALQGLFTR FPDLSLAVPR EEIPWILRPG FTRTRTLPLK 
LV