Gene Sare_3478 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3478
Symbol
ID	5703541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4010837
End bp	4011919
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	72%
IMG OID	641272905
Product	polyprenyl synthetase
Protein accession	YP_001538271
Protein GI	159039018
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0142] Geranylgeranyl pyrophosphate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.395312
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0269783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCTACG CTGCTCCTGT CTCCCCGGTG GACCGCGCCG GGCTCCGGCA ACGCGTCGAC 
AAGGCACTGG CCGACTTCCT GGCGGCCCGA CGCACCTGGA TGACCGACGT CGACGGCTCC 
CTCGCCCCGG TGGCAGACGC GGTCGAGGCA TTCGTCCTCG GCGGCGGCAA GCGACTGCGG 
CCCGCGTTCG CGTACTGGGG CTACCGGGGC GCCGGTGGTA TTGACACCGA ACAGGTGGCG 
ACCGCCCTGG CCGCGCTGGA GTTCGTGCAG GCCAGCGCGC TTATCCACGA CGACCTGATG 
GACCGCTCGG ACACCCGGCG AGGCGAGCCG GCGGTGCACC TGCGGTTCGC CGCGCAGCAC 
CGGTCGGCGG GCTGGGACGG GGACGCGGAC GGGTTCGGCG ACGCAGCGGC CATCCTGCTG 
GGCGACCTGT GCCTGGTCTG GTCGGACGAG CTGCTGCACT CCGCCGGGTT GGACCCACGC 
ACCGTCGCCC GGGCGCGGCC GATCTTCGAC CAGATGCGTT CCGAGGTCAC TGTGGGTCAG 
TACCTCGACG TGCTGACCCA GGCCACCGGG GACACGTCGG TCGAGTGGGC CGGGAAGGTG 
GCTCGTTACA AGTCGGCGAA GTACACCGTC GAACGCCCGC TGTTGCTCGG CGCCGCACTG 
GCCGACGCCA CGCCCGAGAT ACACGCGGCG TACTCGACGT ACGGGCTGCC GCTCGGTGAG 
GCCTTCCAGC TGCGCGACGA CGTGCTGGGT GTCTTCGGCG ACCCGGCACA GACCGGTAAG 
CCGGCCGGCG ACGACCTACG CGAGGGAAAA CGGACGTACC TGGTGGCGGC GGCGCTGGAA 
ACGGTCGACA GCACCGGTCG GGACATGCTG CTCAACAGCC TCGGCGACCC TGGCCTCGAC 
GATGTGGGGG TGGCCCGGCT GCGGGAGCTG ATCGAGGCCA GTGGTGCGCT CGACCGTGCC 
GAGCAGCGGA TCCGCGCGCT CACCGACACG GCACTCGCCG CGCTGTCCAC CGTCGACCTC 
GACACCGAGG CACACCAGGC CCTGGCCGAC CTGGCCATCG CCGCCACCCG CCGCCCCGCC 
TGA

Protein sequence

MTYAAPVSPV DRAGLRQRVD KALADFLAAR RTWMTDVDGS LAPVADAVEA FVLGGGKRLR 
PAFAYWGYRG AGGIDTEQVA TALAALEFVQ ASALIHDDLM DRSDTRRGEP AVHLRFAAQH 
RSAGWDGDAD GFGDAAAILL GDLCLVWSDE LLHSAGLDPR TVARARPIFD QMRSEVTVGQ 
YLDVLTQATG DTSVEWAGKV ARYKSAKYTV ERPLLLGAAL ADATPEIHAA YSTYGLPLGE 
AFQLRDDVLG VFGDPAQTGK PAGDDLREGK RTYLVAAALE TVDSTGRDML LNSLGDPGLD 
DVGVARLREL IEASGALDRA EQRIRALTDT ALAALSTVDL DTEAHQALAD LAIAATRRPA