Gene Sare_4560 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_4560
Symbol
ID	5705418
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	5156489
End bp	5157676
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	70%
IMG OID	641273972
Product	cytochrome P450
Protein accession	YP_001539319
Protein GI	159040066
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.924133
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0532868
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCACGG CACCGGCGTA CTCGCTGGAC GGGGGACGCT CGCTGCATCG GTGGCTGCGG 
GACATGCGAG AGCATCACCC GGTTCATCGG GAGCTGCTCA CTCGCGTGTG GACGCTTTAC 
CGATACCGCG ACATCACCCA GGCCACCGCC GATCCGGCCG TCTTCTCGTC GGAGCTGTGG 
CGGTACCTGC CCGGGGATAG GGGCGACGAC GCCCTGACCG CAGGCAACCT GACCGCAATG 
GACCCGCCCC GGCACCGCCT CGTGCGGGAC CTGGTCAGCC GCTCGTTCAC GGCTCGCGCG 
GTGGGCGCGC TGCGGCCCCG GATCGCCGCG ATCGCGGCCG AGCTGATCGG CGCCGTCGCC 
GACCGCGGCG AGATGGACGT CGTCGCCGAC CTGTCCGACC CGCTGCCCGT CCTGGTCATC 
GGGGAGCTGC TCGGCCTGCC GATGGCGGAC CGCGAGCTGT TGAGCGACTG GGCGCGGCGC 
CTGCTCTCCT TCGACAAGGG CGACCTGACC GACGAGGTGG TCCGCAAGCG TGTCGCCGAC 
ACTCAGCAGG AGCTGCTGGA CTATCTCCGG GTCCACTGCC GGCGTCGCCG GACGAATCCG 
CAGGACGATC TGATCAGCCG GCTGATCCGG GCCGAGGTTG ACGGGCAGCG GCTCACCGAG 
GACGAGGTGG TCAACTTCGC CAACCTCCTC CTGCTCGCCG GTCACGTGAC GACGACGCTG 
CTGCTGGCGA ACATCGTCCT GACACTCGAC GAGCACCCCG CCGTGGCGGC GGAGGCACGC 
GCCGACCGCG GGCTGATCCC GGGACTCATC GAGGAGACCC TGCGATACCG GCCGGTCATC 
GTCAGCAACA TGCGGGTCAC CACCCGCGCG GTCACGGTGG GCACAGAGCA GCTACCGGCC 
GGCCAGCTCG TGTCGCTGTC GTTCATCTCC GGCAACCGCG ACGAGCAGTA CTTCACCGAC 
CCCGACCGGT TCGACATCCA CCGCGACGCC CGCAAGCACC TGGGGTTCGG CCATGGGATC 
CACTACTGCC TGGGTGCGCC GCTGGCCCGC CTCGAACTGG GGATCGCCCT CGATGCGATG 
TTCGACCGCT TCAGCCGGAT CGAGGTGACG GGCGTTCCCG TCGACTACTA CGACACGCCC 
GGGGTCGCCG GTCCGCGTTC CCTTCGCATC GCCTTCCGTC ACCACTGA

Protein sequence

MGTAPAYSLD GGRSLHRWLR DMREHHPVHR ELLTRVWTLY RYRDITQATA DPAVFSSELW 
RYLPGDRGDD ALTAGNLTAM DPPRHRLVRD LVSRSFTARA VGALRPRIAA IAAELIGAVA 
DRGEMDVVAD LSDPLPVLVI GELLGLPMAD RELLSDWARR LLSFDKGDLT DEVVRKRVAD 
TQQELLDYLR VHCRRRRTNP QDDLISRLIR AEVDGQRLTE DEVVNFANLL LLAGHVTTTL 
LLANIVLTLD EHPAVAAEAR ADRGLIPGLI EETLRYRPVI VSNMRVTTRA VTVGTEQLPA 
GQLVSLSFIS GNRDEQYFTD PDRFDIHRDA RKHLGFGHGI HYCLGAPLAR LELGIALDAM 
FDRFSRIEVT GVPVDYYDTP GVAGPRSLRI AFRHH