Gene Sare_2103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2103
Symbol
ID	5704717
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2424024
End bp	2425271
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	71%
IMG OID	641271588
Product	cytochrome P450
Protein accession	YP_001536959
Protein GI	159037706
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0109188
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGCGC CAGCACCGCA GGCGACCCAG TCCACGACCC CGCACCCGCC GAGTTACCCA 
CTGCCCCGCG AGTGCCCCTA TCGCCCTTCC GCCGGTACCG CCCGCCTCCG CGACGCCGGA 
CCGGTCAGTA CCGTCCGCCT GTACGACGGT CGTACCGCGT GGCTGGTCAC CGGGGCGGCC 
GAAGCGCGCG CGCTGCTCGC CGACTCACGA GTCTCCAACC GCGCCGACTT TCCGAACTAC 
CCGGTGATGG ACGAGCGGCA CCTGAGCATG CGGGCCACCC GCGAGATGGC CCGGGAGGAG 
GAAGGCGGCT TCGCCGCCGC CCTCTTCGGC ATGGACCCGC CGGAACACAC CCGGCAACGG 
CAGCTGCTGC TCCCCCGGTT CACGGTCCGG CAGGTCGCAG CGCGGCGGCC GGCGATTCAG 
CGGATCGTCG ATGAGCACCT GGACGCCATG GAGGCCAACG GTTCGCCGGC CGACCTGGTG 
TCGGCGTTCG CCACCCCGGT ACCGACGATG GTGGTGTGCA CGCACCTCGG CGTGCCGTAC 
CAGGACCGGA CGCGCTTCGA GCCGGCCGTG GCCGGGCTGT TCGAACCCGA CCGGGCAGAC 
GCGGCGATGG CGGAACTGAC CGCCTACCTG CACCAACTGA TCGAGACCAA GCAGTCCGAG 
CCAGGCGACG GGGTGATCGA CCATCTGATC GCCAACCACC TGCGCCCGGG TGCGATCGAC 
CGGGCGGAAC TGGTGGCCAT CGCCTCGGCG ATTCTGGTCG CGGGCACGGT CACCACCTCC 
AGCGCGATCG CCCTGGGCAC GCTCGCCCTG CTGACCGCCC CGGGACAGTA CGCGGCGCTG 
GTGGACAACC CGGACCTGGT GCCGGGCGCG GTGAACGAGA TCCTGCGGTA CCTGTCCCTG 
GTCGAGCAAC TCGCCCGGGT CGCCACCGAG GACATCGAGA TCGGCGGCAA GCTGATCCGG 
GCAGGCGACG GCATCATCGT CAGCTTCGCC GCCGGCAACC TCGACCCGAA CGTCACCACG 
CACCCCGACC GTCTGGACGT AGCCCTGCCG CCCACCAACC ACCTCGCCTT CAGCCACGGC 
ATCCACCACT GCATCGGCCA GAACCTGGCG CTACTGGAAC TCGACATCGC CTTCCGGGCC 
CTCGTCAGCC GGTTCCCGAC GCTGCGCCTG GCGGTGCCCG CCGAGCAGTT GCCCACCTAC 
TTCGCCGGCG ATGTTCCCCG GCTCGCCTGC CTTCCCGTCA CCTGGTGA

Protein sequence

MAAPAPQATQ STTPHPPSYP LPRECPYRPS AGTARLRDAG PVSTVRLYDG RTAWLVTGAA 
EARALLADSR VSNRADFPNY PVMDERHLSM RATREMAREE EGGFAAALFG MDPPEHTRQR 
QLLLPRFTVR QVAARRPAIQ RIVDEHLDAM EANGSPADLV SAFATPVPTM VVCTHLGVPY 
QDRTRFEPAV AGLFEPDRAD AAMAELTAYL HQLIETKQSE PGDGVIDHLI ANHLRPGAID 
RAELVAIASA ILVAGTVTTS SAIALGTLAL LTAPGQYAAL VDNPDLVPGA VNEILRYLSL 
VEQLARVATE DIEIGGKLIR AGDGIIVSFA AGNLDPNVTT HPDRLDVALP PTNHLAFSHG 
IHHCIGQNLA LLELDIAFRA LVSRFPTLRL AVPAEQLPTY FAGDVPRLAC LPVTW