Gene Sare_2032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2032
Symbol
ID	5705686
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	2325839
End bp	2327044
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	72%
IMG OID	641271522
Product	cytochrome P450
Protein accession	YP_001536893
Protein GI	159037640
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2124] Cytochrome P450
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0674155
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0677
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTGGCCG ATGCCGTGAC CGCGTTCGAT CCGACCGCCG TCGACGTTCG GCGCGACCCG 
TACCCGTCGT ACCACTGGCT GCTCCGCCAC GATCCGGTGC ACCGGGGCGC CCACCAGGTC 
TGGTACGTCT CGCGTTTCGC CGACGTCCGC GCGGTACTCG GCGACGAACG GTTCGCCCGT 
ACCGGCATCC GCCGGTTCTG GACCGATCTG GTCGGGCCCG GCCTGCTCAG CCAGATCGTC 
GGCGACATCA TCCTGTTCCA GGACGAGCCA GACCACGGCC GGCTACGTGG TGTGGTCGGC 
CCGGCCTTCT CCCCGTCGGC GCTGCGCCGC CTGGAACCGA CGATCGAGGC CACCGTCAAC 
GACCTGTTGC GCCCGGCGCG GGCCCTCGGC GCGATGGATG TGGTGGCCGA CCTGGCGTAC 
CCGCTGGCGC TGCGCGCGGT GCTCGAGCTG CTCGGCCTAC CGGCCGGCGA CGCCAACACG 
GTCGGCCGCT GGTCGCGTGC GGTGGGCCGG ACACTGGACC GGGGCGCCAC CGCCGAGGAC 
ATGCGGCGGG GACACGCGGC CATCGCCGAG TTCGCCGACT ACGTGGAACG GGTGCTGGCC 
GAGCGCCGCG AGGACGGTGC GGACCTGCTG GCCCTGATGC TCGCCGCCCA CCGGAGCCAG 
CTGATGAGCC GCAACGAGAT CGTCAGCACC GTGGTCACCT TCATCTTCAC CGGTCATGAG 
ACGGTGGCCA GCCAGCTGGG CAACGGCCTG CTCAGCCTCC TGGACCACCC GGAGCAGATG 
GAGTTGATGC GCCGACAGCC GCACCTGCTA CCACACGCGG TCGAGGAATG CCTGCGCTTC 
GACCCGGCGG TGCAGTCGAA CACCCGACAG TTGGCGGCCG ACGTCGAGCT GCACGGCCGG 
CGGCTGCGCC GCGACGACGT CGTGGTGGTC CTCGCCGGCG CGGCCAACCG GGACCCCGGG 
CGGTACGACC GGCCCGACGA GCTCGACATC CGCCGCGACC CCGTCCCGTC GATGTCCTTC 
GGGGCGGGCA TGCGCTACTG CCTCGGGTCG TACCTGGCCC GGCTTCAGCT GCGTACCGCT 
CTCGGCGCCA TGGTCGCGCT GCCGGACCTG CGCTTGGTCT GCAGCCCGAA CGAACTGGCC 
TACCAGCCTC GCACGATGTT CCGTGGTCTC ACGAGGCTGC CGGTCGCGTT CACGCCGGCC 
GGCTGA

Protein sequence

MLADAVTAFD PTAVDVRRDP YPSYHWLLRH DPVHRGAHQV WYVSRFADVR AVLGDERFAR 
TGIRRFWTDL VGPGLLSQIV GDIILFQDEP DHGRLRGVVG PAFSPSALRR LEPTIEATVN 
DLLRPARALG AMDVVADLAY PLALRAVLEL LGLPAGDANT VGRWSRAVGR TLDRGATAED 
MRRGHAAIAE FADYVERVLA ERREDGADLL ALMLAAHRSQ LMSRNEIVST VVTFIFTGHE 
TVASQLGNGL LSLLDHPEQM ELMRRQPHLL PHAVEECLRF DPAVQSNTRQ LAADVELHGR 
RLRRDDVVVV LAGAANRDPG RYDRPDELDI RRDPVPSMSF GAGMRYCLGS YLARLQLRTA 
LGAMVALPDL RLVCSPNELA YQPRTMFRGL TRLPVAFTPA G