Gene Sare_1959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1959
Symbol
ID	5703608
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2252621
End bp	2254006
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	66%
IMG OID	641271464
Product	XRE family transcriptional regulator
Protein accession	YP_001536835
Protein GI	159037582
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.24175
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCAAG CCCCGCGGGC GCTCCAGCCA TCCCTGTCCG AGCGCAACTT CTTCGGCGCG 
GAACTGCGCC GGCTGCGCGA ACGCGCGAAC CTCTCGCAGG CGCGGCTGGG CACCATGATC 
CGTTTCAGCG CGGACCTGGT TCGTCGCGTG GAAACGGCCG ACCGGTTCCC CTCCCGTGAG 
TTCGCCGAGG CCTGCGACAA GGCACTGGCG ACCGGGGGCG CACTGATGCG CCTGCTGCCG 
CTGCTCGACA AGAACCGGGC CAGCGACAGC AGGCCGGCCA ACACCTCGCC AGCCGGCGTC 
GGCCTCAGCA GCGTTCTATC TGATCGCCTG GCCGAAACGT CGAGGTTGGC CGAGATGGTT 
GCTCGGGTTC CGTTCCAACC CGGTGTCCTC GATCGCGCCG CCCTTGACTG GATAAACGCT 
GCGGCGGGAC CCCGACTGTC CGTGGCCGGA CGACCCGGCT CGCCTGACCA AGTTGACGAA 
GGAGATCTTC ATTCGGTGGA GACCGCTCTG GCGATGTACC GGCAGCTGGA CCACACCCAC 
GGCGCCGGAC GAGTGCACGC CCAAGTGCAG CGCTACGTCG AAGGTGAACT GAACCGGCTG 
CTGGCGAACA GCCCCGTCTC CGAGACGGCG GGGCGGCGGC TCTACAGGCT TGCGGCAGGT 
TTCTTCGAAC TGTGTGGATA CCAAGCGGTC GACAGCGGTG CCCATGGCCT TGCCCAGCGC 
CGCTATCTTC GCGCTCTGCG TCTGACGGAA GCTGCCAATG ACCGCTTGTA CGGAAGCTAC 
TTACTCGCCG TGAATATTGG GCACCTAGCG CTGCACTGCG GGCATCCCGA GCCGGCGCAC 
AGGGTGGCGA TGACGGCGGT GAGAGGAAGC GAAGCCCAAG TGACACCCGC TGTGGCAGCA 
GCGCTGCATG CGGTGGTGGC GCGTACGCAC GCCCGTCTTG GTCGCGAAGG CGATTGCCTT 
ACCCACCTCG ACATTGCTGA AAGGCAGTTA GCCCTAAGTA CGGTCGAGGA CGAGCCCGTG 
TGGATTCGGT ACTTCAACGC GGCGTATCTC GCCGACGAGA TGGCGCACTG CTTCCATGAC 
CTGGGTCAAC CGCGGCAAAC CCAACGGCAC CTGGGCGATG CCCTTACCGT CCTGAGCCCC 
ACACATGTCC GGCGACTCGC CATCGACACC GCGCTCATGG CCTCATCGTG GGCCGTGTCC 
GGCCGCATCG ATGAAGCCTG CGCCACCGCA CGACAGGCAG TCGACTATGC CGCACAAACC 
ACCTCACATC GCTGCCTGCA GCGCATCGTC GAGGTGCAGG TTGACCTCGA GCCCTATCGG 
TGTGAGCCGG AAGTCCGCGA ACTCGGCGAG TATGTTCGTC ACCGGCTACC GTTGGCAGCG 
GTGTAG

Protein sequence

MGQAPRALQP SLSERNFFGA ELRRLRERAN LSQARLGTMI RFSADLVRRV ETADRFPSRE 
FAEACDKALA TGGALMRLLP LLDKNRASDS RPANTSPAGV GLSSVLSDRL AETSRLAEMV 
ARVPFQPGVL DRAALDWINA AAGPRLSVAG RPGSPDQVDE GDLHSVETAL AMYRQLDHTH 
GAGRVHAQVQ RYVEGELNRL LANSPVSETA GRRLYRLAAG FFELCGYQAV DSGAHGLAQR 
RYLRALRLTE AANDRLYGSY LLAVNIGHLA LHCGHPEPAH RVAMTAVRGS EAQVTPAVAA 
ALHAVVARTH ARLGREGDCL THLDIAERQL ALSTVEDEPV WIRYFNAAYL ADEMAHCFHD 
LGQPRQTQRH LGDALTVLSP THVRRLAIDT ALMASSWAVS GRIDEACATA RQAVDYAAQT 
TSHRCLQRIV EVQVDLEPYR CEPEVRELGE YVRHRLPLAA V