Gene Strop_4051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_4051
Symbol
ID	5060533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	4606573
End bp	4607643
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	72%
IMG OID	640476312
Product	polyprenyl synthetase
Protein accession	YP_001160859
Protein GI	145596562
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0142] Geranylgeranyl pyrophosphate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATCCGG CTGACAAGCT CTCGGGTGCC ACTGGCGTGG GCAGTCGCTC CGACCGGGGC 
GGCGCAGGTC AGTTGGGTGC CGTCGGGCTG CACCCAATCG ACGCGGGGCT CCCGGATTCA 
GCGTTTCGGG TGCTGGAGGG GGTCGAGGCC GCGCTGCGGG CTGATGTCGC CAGCGCCGAC 
CCGTTCGTCA CCGAGGCCGC CCGGCACCTC CTTGACGCCG GTGGCAAGCG GTTCCGCCCG 
CTGCTGGTGG CGCTCGGCGC CCAGTTCGGG GATCCGACTC GGGAGCAGGT CGTGCCGGCC 
GCCGTGGTGG TGGAGCTCAC CCACCTGGCC ACGCTTTACC ACGACGACGT CATGGACGAG 
GCGCCGGTGC GCCGGGGGGC CCCGAGCGCC AACTCGCGGT GGACGAACTC GGTGGCCATC 
CTGGTCGGTG ACTATCTCTT CGCCCGCGCC GCGGACATCT CCGCGGATCT GGGCACCGAG 
GCGGTCCGAC TGCAGGCGCG GACCTTCGCG CGCTTGGTGC ACGGCCAGAT CGCCGAAACC 
GTGGGGCCGC GTCCCGGTGT GGATCCGGTG GCGCACCACC TGCACGTGAT CGCTGAGAAG 
ACCGGCTCGC TGATCGCTAC CGCGGCCCGG TTCGGTGGGA TGTTCAGCGG GGCCAGCCCG 
ACGCACACCC AGGCACTGGC TGGTTACGGT GAGGCGATCG GGGTCGCCTT CCAGCTCTCC 
GACGACCTGT TGGACATCTC CAGTGAGGCG GAGCGCTCCG GCAAGACGCC GGGGACCGAT 
CTCCGTGAGG GTGTCCCCAC CCTGCCGGTG TTGTATGCAC TCGCCTCGGA CGACGCGGAC 
GCCGCGTCGG TGCGGCTTCG GGAGGTCCTG GCGGTCGGTC CGCTGACCGA TGACGAACTG 
CACGCCGAGG CGCTCGGACT GCTCCGGGAG AGCCCGGCGT TGAAGCGGGC GCGGGAGACG 
GTCCGTAGCC GTGCCGAGGA AGCGCGCGCG CAGCTTGCGC CGCTGCCGCC GGGCCCGGCC 
CGGCACGCGC TCGAATCCCT CTGCGACCAG ATCGCGGACC GGACCGGCTG A

Protein sequence

MNPADKLSGA TGVGSRSDRG GAGQLGAVGL HPIDAGLPDS AFRVLEGVEA ALRADVASAD 
PFVTEAARHL LDAGGKRFRP LLVALGAQFG DPTREQVVPA AVVVELTHLA TLYHDDVMDE 
APVRRGAPSA NSRWTNSVAI LVGDYLFARA ADISADLGTE AVRLQARTFA RLVHGQIAET 
VGPRPGVDPV AHHLHVIAEK TGSLIATAAR FGGMFSGASP THTQALAGYG EAIGVAFQLS 
DDLLDISSEA ERSGKTPGTD LREGVPTLPV LYALASDDAD AASVRLREVL AVGPLTDDEL 
HAEALGLLRE SPALKRARET VRSRAEEARA QLAPLPPGPA RHALESLCDQ IADRTG