Gene Sala_3135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_3135
Symbol
ID	4082391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	3286985
End bp	3288142
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	68%
IMG OID	638011520
Product	lycopene cyclase
Protein accession	YP_618171
Protein GI	103488610
COG category
COG ID
TIGRFAM ID	[TIGR01789] lycopene cyclase [TIGR01790] lycopene cyclase family protein

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGGGGC CGAACATCGA TAAATGCGAC ATCGCGATCG TCGGCGGCGG GCTTGCGGGC 
GGACTTGCGG CGCTGGCGCT GGCGGCCAAG CGGCCCGATC TCGACATACG ACTGATCGAG 
CCGGGGCCGG TCGGGGGCAA TCATATCTGG TCCTTTTTCG ACAGCGACAT CGCAAAGAAG 
GACCGCTGGC TCGTCGCGCC GCTCGTCCGC CACCACTGGC CGCGCTATGA CGTGCGCTTT 
CCCGCGCACG CGCGGACGCT GCACATGGGA TATAAAAGCA TCACCGGCGA AGCGCTGGCC 
GAAGCGGTGG CGGCGGCGCT GCCGGACGGC CATATCATCG CCGATCGCGC GAAACATGTC 
GCGCCCGACC ATCTGCTGCT GGCGCGCGGC GGGCGATTGT CGGCGAAGCA TGTCCTCGAC 
GCGCGCGGCG CGGGCAAGTT TCCGACACTG GACTGCGGCT GGCAGAAGTT TGTCGGGCAG 
GCGCTCACCG TGAAGGGCGG GCACGGCGTC GAACAGCCGG TGGTGATGGA CGCGACGGTG 
GAGCAATTGG ACGGCTATCG CTTTGTCTAT CTCCTCCCCT TCGACGCCGA AACCCTGTTC 
GTCGAGGACA CCTATTACAG CGACGACGCC GACCTCGACG AAATGGTGGT GCGCGAACGC 
ATTGCCGCCT ATGCCGCGGC GCAGGGCTGG CAGGTGACGG CGACGATGCG CGAGGAGAGC 
GGCGTGTTAC CAGTGGTGAT CGCGGGCGAT TTCGACCGGT TGTGGCCGGA ATCGGACCGC 
ACGTCACGAA TCGGCGTGCG CGCAGGGATG TTCCACGCGA CGACGGGTTA TTCGCTGCCG 
CACGCCGTAC GCACCGCGGC GGCGCTGCCC GCGCTGGTCG GTCGCGCCGA CCTGCCCGCG 
CTGCTGCGCG CGCGCGCGCA GTCGGCGTGG CGGCGCCAGC GCTTTTACCG GATGCTGGAC 
GCCATGCTGT TCCGCGCCGC CGATCCCGAT AGGCGTTACC GCATTTTCGA GCGATTCTAT 
CGCCTGTCGC CGCGGCTCGT CGCGCGCTTC TATGCCGGGC GGTCGACCGC GGCGGACCGG 
CTGCGCCTGC TTGCGGGAAA GCCGCCGGTG CCGGTCGGCC GCGCGCTGTC GGCGCTTGCA 
AAACTGGATT GGAAATGA

Protein sequence

MVGPNIDKCD IAIVGGGLAG GLAALALAAK RPDLDIRLIE PGPVGGNHIW SFFDSDIAKK 
DRWLVAPLVR HHWPRYDVRF PAHARTLHMG YKSITGEALA EAVAAALPDG HIIADRAKHV 
APDHLLLARG GRLSAKHVLD ARGAGKFPTL DCGWQKFVGQ ALTVKGGHGV EQPVVMDATV 
EQLDGYRFVY LLPFDAETLF VEDTYYSDDA DLDEMVVRER IAAYAAAQGW QVTATMREES 
GVLPVVIAGD FDRLWPESDR TSRIGVRAGM FHATTGYSLP HAVRTAAALP ALVGRADLPA 
LLRARAQSAW RRQRFYRMLD AMLFRAADPD RRYRIFERFY RLSPRLVARF YAGRSTAADR 
LRLLAGKPPV PVGRALSALA KLDWK