Gene Sare_1061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1061
Symbol
ID	5705674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	-
Start bp	1189052
End bp	1190524
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	69%
IMG OID	641270577
Product	UbiD family decarboxylase
Protein accession	YP_001535961
Protein GI	159036708
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0281996
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCACT TCACCGACCT ACGTGGCTAT CTCGACGCAC TCGACGCGCT CGGTGACCTG 
AGGACCATCG AGCGGTCCGT GAGTGTCGAC CTGGAAGCAG CGGCGATTAC CCGCCGCTCG 
TACGAGATCC GCGCCGCCGC ACCGCTGTTC ACCAACATCG CCGAGGACCG GACAGGCATG 
CGGATGTTCG GGGCTCCCGC CGGTGTCAGC TCCCGAGCCG ACATGCCGCT CGCCCGGCTC 
GCGCTCTCCG TCGGCCTGCC ACCCGAGACC GGTGCGGCGG CACTCGTGGA CCACCTCGTC 
CGCGTCCGCG ACGCGGTGCC CGTACCGCCG CGGGCGGTGC CGCGCGAGAA CGCGCCGTGC 
AAGCAGAACG TGTTGCTCGG TAGGGAGGCG ACACTGGACC GGTTCGCGGT CCCACGTCTG 
CACGAGTCCG ACGGCGGCCG GTACCTCAAC ACCTGGGGTG TGATCGTTGT CAGGACGCCC 
GACGGTGCGT GGGTCAACTG GTCGATCTCG CGGATCATGA TGCTCGACGG CAAACGGATG 
ACAGGCCTGG TGGTGCCACC GCAGCACCTC GGTCTGGTCT GGCAGGCGTG GGCCGAGCGC 
GGTGAGCCGA TGCCCTACGC GCTGGTGCAG GGCGGCGCCC CGGCGATTCC CTTCGTGGGC 
GGTATCCCGC TGCCGCGCGG GGTGGACGAG GCCGGGTACA TCGGCGCGCT GCATGGGGAG 
CCGGTCGAGG TGGTGCGCTG CGAAACCTCC GACCTGGAGG TACCCGCGCA CGCCGAGGTG 
GTCATCGAGG GACACATGTC GGTGGGCCGG GACAGCCGTG AGGGGCCGTT CGGCGAGTAC 
GCCGGCTACG CCTCCACCCA GTCCTCCACC CAGCCGGTGT ACTCGGTGGA GGCCATCACC 
TACCGCGACG ACCCGATCTG GCCGATCGTC CCGGAGGGCC GGCCGCCCGA CGAGTACCAC 
ACCGTGACCG GCACCGGTCG CGCCGCGAAC GTCCTGCACG CGCTGCGACG GGCAGGGCTG 
CCGGTGACCA CGGTGTGGAT GCCGTTCCCG GCAGCGATGC ACTGGACCGT GGTGACCGTC 
CCGGACGACT GGCGGTCGCA CCTACCCGGG GTGGACTCCG GAGAGTTCGT ACGACGAATC 
GGCGAGGTCA TCCACAACAG CGGTGGACCC AGCGCGATGA TGCCGGTCAC CTTCGTTCTG 
GATGATGACA TCGACCCCTC CAACGAGGCC GACCTGCTGT GGGCGCTGTC CACCCGGTTG 
CATCCGAAGG ACCGACGCTT CGCCTGGGAC GGTGTGGTCC TACCGTTCAT GGCCTGCTAC 
ACCGAAGACG AGCGCAAGAC GATGCGTGGT CCGAGTGTCG TCCATGACGG GCTGCTGCCT 
GCCTGGGGCG AGGGCCGGCT GCACCACAGT TCCTTCGCCC AGGCCTACCC CGCCGACATC 
CGCCGCAGGG TGCTCGAGCA CGAAGACGGT TGA

Protein sequence

MSHFTDLRGY LDALDALGDL RTIERSVSVD LEAAAITRRS YEIRAAAPLF TNIAEDRTGM 
RMFGAPAGVS SRADMPLARL ALSVGLPPET GAAALVDHLV RVRDAVPVPP RAVPRENAPC 
KQNVLLGREA TLDRFAVPRL HESDGGRYLN TWGVIVVRTP DGAWVNWSIS RIMMLDGKRM 
TGLVVPPQHL GLVWQAWAER GEPMPYALVQ GGAPAIPFVG GIPLPRGVDE AGYIGALHGE 
PVEVVRCETS DLEVPAHAEV VIEGHMSVGR DSREGPFGEY AGYASTQSST QPVYSVEAIT 
YRDDPIWPIV PEGRPPDEYH TVTGTGRAAN VLHALRRAGL PVTTVWMPFP AAMHWTVVTV 
PDDWRSHLPG VDSGEFVRRI GEVIHNSGGP SAMMPVTFVL DDDIDPSNEA DLLWALSTRL 
HPKDRRFAWD GVVLPFMACY TEDERKTMRG PSVVHDGLLP AWGEGRLHHS SFAQAYPADI 
RRRVLEHEDG