Gene Strop_2437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_2437
Symbol
ID	5058900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	-
Start bp	2738466
End bp	2740259
Gene Length	1794 bp
Protein Length	597 aa
Translation table	11
GC content	71%
IMG OID	640474696
Product	transcriptional activator domain-containing protein
Protein accession	YP_001159262
Protein GI	145594965
COG category	[T] Signal transduction mechanisms
COG ID	[COG3629] DNA-binding transcriptional activator of the SARP family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0868593
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.755858
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTCGG TCGCGGTGAG CCCATCCGGC GGTGACCAGC GAGCCCGCCC GGCGGTGTTC 
CGGGTGCTCG GCCCGCTGAC CCTCAGCAGC GGCGGGGACA CGCTGGTTCT GCCGCCGTCG 
AAGGTGACCT CGTTGCTTGC CGTGCTGCTG TTGCACCCCG ACGAGGTGAT CTCGGTCAGT 
ACCCTGCAGC AGGCTGTCTG GGGTGACGCG CAGCCTGCCT CGGCCAAGGC CGCGTTGCAG 
ACCTGCACCC TGCGGCTTCG GCAACTGTTT CACCGGCACG GCATCACCGG CAGCGTGATC 
AAGACAGTGC CGGGTGGCTA CCGGATCACC GCTACCGCCG CCACCGTCGA CCTGATGCGC 
TTCCGCGAGT TGATCGGCCG TACCCGCGAC GTGCCGGATC CAGAGGCGGA GCTGGCGAGG 
CTGGAGGAGG CGCTCGCGCT GTGGAGCGAC CCAATGCTGG CCAATGTGCC ATCAGAGGCG 
CTGCACCGGG ACGTGGTACC CCGGATCAGC GAGGAGCGGG TCCGGGCGAT CGAGCGGGTG 
TGCGACCTGA AGATCAGCCT CGGTCGGGAC CGGTCCGCGC TGGTGGACCT CTGGACCGCC 
AACCGCGCGT ACCCCGCGAA CGAGCGCTTC TCCGCACAGC TCGCCTCGGT GCTCTACCGC 
ACCGGTCGGC AGGCGGACGC CCTGGCCGAA CTGCGCCGGA TCCGGGACTA TCTTCGCCAC 
GAACTCGGCA TCGCTCCGGG CCCGACCCTG CGGGAGTTGG AGCTGACCAT TCTGCGGGGC 
GAAGCGTCCA CTCCGGTCGC TCCAGTAGGG AGACCCGCCA CCGTAGTGTC CCGGCACCCG 
GTCGCGTCCA GCCTCATCGG TCGGGACGCG CTCGGCGAGA CCGTCGCCGA GCGCCTCCGC 
GCGGATTGCC CGATCGTGGT GCTCACCGGC CCACCCGGCG TCGGCAAAAC CGCGCTGGCG 
CAGCACGTCG GGCAGCTCGT CGCCCCCCAC TTCCCCGGCG GTCAACTCCG GGTGGCGGCG 
GACACCGTGT CGCACGACGC CCAACGGCGG CTGATCACCC CGGTTGACCA GGGCCACGGT 
GCCCAGGTGG GCCGACGGCT GCTGTTCGCC GACGACGTGG TCAACGGCAG TCAGGTACGA 
GCCCTGCCGG CCCTTTTGGC ACCCGGTGAC GCGCTGCTGC TGACCAGTCG CCAAAGCCTG 
TCTGGTCCGG TTACCCGACT TGGCGGCTGG TTGCACCGGG TGGAGCCGCT CGAGCCTGCC 
GACTCGCTCC AGTTGCTCCG TTCCGCGCTG GGACCCGAGC AGGTCGATGC CGACCCGCAG 
AGCGCCGCGG AGATCGCGGC GCTCTGCGAC CACCTGCCAC TCGCGCTGCG CATCGCCGCC 
ACCCGCATCC TGCTGCGCCC CCGGACGGAA CTCGCGGCGG CGGCGGAGTG GCTGCGTGCG 
GACCCGCTGA GCCGGCTGAG TCTGCCCGGC GAACCGGACA TGTCACTCGG CCACCGCTTC 
GACGAGGCCC TGTCCCGAGC CGGCGAAACG TTGGAGGCGG CCTTCGTCAG GCTGGCCACC 
GCGGCCCCCG CCGCCATCAC CGCCGCACCG GCCGCACAGC TGCTCGACGT TGACCCGGCC 
ACGGCTCGCG ACCTGCTCGA CGGGCTGGTC GACCACAGCC TGGTCGAGGA GGCCGCGGAT 
CACTACTGGA TACGAGCCTT GCTGCGGCGA CACGCCCAAC TCGCGGCCGA ACGGCACGCC 
CCCCACCCCG ACCCACCGCG ACGGCCGCAC CGAGCGAAGG GATCCATGCG ATGA

Protein sequence

MESVAVSPSG GDQRARPAVF RVLGPLTLSS GGDTLVLPPS KVTSLLAVLL LHPDEVISVS 
TLQQAVWGDA QPASAKAALQ TCTLRLRQLF HRHGITGSVI KTVPGGYRIT ATAATVDLMR 
FRELIGRTRD VPDPEAELAR LEEALALWSD PMLANVPSEA LHRDVVPRIS EERVRAIERV 
CDLKISLGRD RSALVDLWTA NRAYPANERF SAQLASVLYR TGRQADALAE LRRIRDYLRH 
ELGIAPGPTL RELELTILRG EASTPVAPVG RPATVVSRHP VASSLIGRDA LGETVAERLR 
ADCPIVVLTG PPGVGKTALA QHVGQLVAPH FPGGQLRVAA DTVSHDAQRR LITPVDQGHG 
AQVGRRLLFA DDVVNGSQVR ALPALLAPGD ALLLTSRQSL SGPVTRLGGW LHRVEPLEPA 
DSLQLLRSAL GPEQVDADPQ SAAEIAALCD HLPLALRIAA TRILLRPRTE LAAAAEWLRA 
DPLSRLSLPG EPDMSLGHRF DEALSRAGET LEAAFVRLAT AAPAAITAAP AAQLLDVDPA 
TARDLLDGLV DHSLVEEAAD HYWIRALLRR HAQLAAERHA PHPDPPRRPH RAKGSMR