Gene Sare_3155 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3155
Symbol
ID	5706104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	3617408
End bp	3618676
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	67%
IMG OID	641272587
Product	cytochrome P450
Protein accession	YP_001537954
Protein GI	159038701
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.66527
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0133276
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGGTG AGCTCACCGA TCAGCGGACG GCGCCGGGTG CCGGTGGCAA CCCTCTGCGC 
AGCTTGATGG ATCACGGCAT CCGGGCCAAC CCCTACCCCC TGTTCGGTGA GCTGCGGGAG 
GCAGGACCAA CCGCCGTCGA GGACGGCTCG GTGGTGCTCT TCGGCGAGTA CGAGCACTGC 
TCGCAGATCC TGCGGCACCG CGACATGGGC AGCGACACCT CCGAGGCCCC GTCCATCAAG 
GGCTTCGTGG TCGACGACGC CGAACGTGCT GGCAGCTCAA TCTTCTTCAT GGACCAGCCC 
GGGCACGGCC GCCAGCGCAA GCTCGTGTCG AAGTCGTTCA CCCCGAGGAT CGTGAAGAGC 
TTCGGCCCGC AGATCACCCA CATTGTGGAC GGCCTGTTCG AGGACTTCCG GGACAGGGGT 
GAGCTGGACG TGGTCACCGA TCTCGCGTAC CCGGTGTCCA TCGGCATCAT CTGCGACCTG 
TTCGGCATCC CGGACGACGA GCGCGACATG CTCAAGGAAT GGTCCGACGA CCTGGCGCTT 
TCGACCGAGC TGCCGACGCT TGGCGCGGCC ATCGGCGTGC TGAACGTCTT CACCCGTGAC 
GAGATCAACC GGTTCGGCAG CGTCGCCATG GCCGCGCACG CCTACTTCGC TGACCTGATC 
CACCGCCGCC GCAAGAACCC CGGCGACGAT CTGGTCTCCA GCCTGCTGGC TACCGAGAGC 
AACGGTGAGC GGCTCACCCG CTTCGAGGTG ACGAGCGTGC TGGCCACCCT GTTCGTGGCC 
GCCCACGAGT CGACCACCAA TCTCATCTCC GGCGGTATCC TGGCGCTGCT GCGTAACCAG 
GACCAGATGG CCGTGCTGCG GGAGAACCCC GGCCTGATCA CGAACGTGGT CGACGAGTCA 
CTGCGCTACG ACCCGCCGGT ACACCTGGCA GCCCGGATGG CCCGGGCCCG CACCACCATC 
GGCGGGTACG ACCTCGACCC CGGCACCATC GTGGTGGTGC TCATGGCCGC CGGTAACCGC 
GACCCCCGCG CGTACGAGAG CCCCGATGTG TTCGACGTCA ACCGGAAGAT CAGGAACGTG 
TCGCTGGCGT TCGGGGCGGG CGCCCACTTC TGCATCGGAT CCGGCCTGGC CAAGCTCGAG 
GCCGAGATCG CCATTTCCGC CTTCGCCCAG CGGCTCAAGC ACCCCGAGGT CGACGAGAGT 
TCGCTCGAGT ACCGCCGGCA CATCGTCGTC CGTGGCCTGG AGCACATGAA GGTCTCCTTC 
CAGCCCTGA

Protein sequence

MSGELTDQRT APGAGGNPLR SLMDHGIRAN PYPLFGELRE AGPTAVEDGS VVLFGEYEHC 
SQILRHRDMG SDTSEAPSIK GFVVDDAERA GSSIFFMDQP GHGRQRKLVS KSFTPRIVKS 
FGPQITHIVD GLFEDFRDRG ELDVVTDLAY PVSIGIICDL FGIPDDERDM LKEWSDDLAL 
STELPTLGAA IGVLNVFTRD EINRFGSVAM AAHAYFADLI HRRRKNPGDD LVSSLLATES 
NGERLTRFEV TSVLATLFVA AHESTTNLIS GGILALLRNQ DQMAVLRENP GLITNVVDES 
LRYDPPVHLA ARMARARTTI GGYDLDPGTI VVVLMAAGNR DPRAYESPDV FDVNRKIRNV 
SLAFGAGAHF CIGSGLAKLE AEIAISAFAQ RLKHPEVDES SLEYRRHIVV RGLEHMKVSF 
QP