Gene Sare_3619 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_3619
Symbol
ID	5708166
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	4175806
End bp	4177032
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	74%
IMG OID	641273044
Product	PucR family transcriptional regulator
Protein accession	YP_001538408
Protein GI	159039155
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism [T] Signal transduction mechanisms
COG ID	[COG2508] Regulator of polyketide synthase expression
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000689812
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGAGCGAGC CGGGAACCGA ACTGGCGGCC ACGCTGCGCC GGATCGAGCG GGCGGCGGGG 
GCGCTCGCCA CGGCCAGCGT GGCGCGGATG GACGAGACGC TGCCCTGGTT CCGCGAACTC 
CCGGCCGACC AGCGCTCCTG GGTCATGCTG GTGGCGCAGG CAGGCGCCCG TTCCCTGGTG 
CAATGGCTCC GCGCCGGCGG CGGCACCGCC GACAGCACCC AGGAGGTTTC CGACGAGGTC 
TTCGCCACGG CGCCGCAGGC CCTGGCACGG TCCATCAGCC TCCAGCAGAC GGTGGCCCTC 
ATCAAGGTGA CCATCGACGT GGTGGAGGAG CAGGTCCCAC ACCTGGCCGC CCCGGGCGAG 
GAGCCACAGT TGCGGGATGT GGTGCTGCGC TACTCCCGGG AGATCGCATT CGCCGCCGCC 
CGGGTGTATG CGCGGGCCGC CGAGTCCCGC GGTTCCTGGG ACGCGCGGCT TCAGGCTCTC 
CTGGTGGACG CGCTGCTGCG GGGTGACTCG CCGGACGTGT TGGCCAGCCG GGCGGCGGCA 
CTGGGCTGGG CGGACGCGCC GCCGGTGGCG GTGGCGGTGG GGCGGTCCCC CGGCGGGGAG 
GTGTCCGCCG TGTTGCACAC CGTCTACCGG CTGGCCCGGC GGATCGGCGC CGAGGTCATC 
GGCGGGGTGC ACGGCGACCG CCTGGTCATC GTGCTCGGTG GCGTGGCCGA TCCGGTGGCC 
GCCACCGGCA AGCTGCTCGA CGCCTTCGGC GCCGGCCCGG TCGTGGTGGG CCCGGCCGTG 
CCGAGCCTGG ACGAGGCCAC CGACTCCGCC CGGGCCGCGC TCGCCGGGTT CCGTGCTGCC 
CCGGCCTGGC CGGCCGCACC GCGGCCGGTC CCCGCAGCCG ACCTGCTACC GGAACGGGCG 
CTCGCCGGGG ACGCCGAGGC GCGCCGCCGG CTGCGGCACG ACGTGTACGC CACGCTGGTC 
CGCTCCGGCG GGGAACTACT GGAGACCCTG GACGCCTTCT TCTCCGCCAG CGGCACCCTG 
GAGAGCGCGG CCCGGGCGCT GTTCGTACAC CCCAACACCG TGCGGTACCG GCTGCGACGG 
GTAGCGGAGG TGACCGGGCT CTCCCCGCTC GCGGCCCGGG ACGCGTACGC GCTCCAGGTG 
GCGCTCACCG TCGGCCGGCT CGACCCGGTG GTTACCCTCA CACCGAATCG GACAAAACCT 
CATATATCTC GTGAGACAGG ACAATAA

Protein sequence

MSEPGTELAA TLRRIERAAG ALATASVARM DETLPWFREL PADQRSWVML VAQAGARSLV 
QWLRAGGGTA DSTQEVSDEV FATAPQALAR SISLQQTVAL IKVTIDVVEE QVPHLAAPGE 
EPQLRDVVLR YSREIAFAAA RVYARAAESR GSWDARLQAL LVDALLRGDS PDVLASRAAA 
LGWADAPPVA VAVGRSPGGE VSAVLHTVYR LARRIGAEVI GGVHGDRLVI VLGGVADPVA 
ATGKLLDAFG AGPVVVGPAV PSLDEATDSA RAALAGFRAA PAWPAAPRPV PAADLLPERA 
LAGDAEARRR LRHDVYATLV RSGGELLETL DAFFSASGTL ESAARALFVH PNTVRYRLRR 
VAEVTGLSPL AARDAYALQV ALTVGRLDPV VTLTPNRTKP HISRETGQ