Gene RoseRS_1735 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_1735
Symbol
ID	5208692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	2135835
End bp	2137025
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	59%
IMG OID	640595341
Product	putative transcriptional regulator
Protein accession	YP_001276075
Protein GI	148655870
COG category	[K] Transcription
COG ID	[COG2865] Predicted transcriptional regulator containing an HTH domain and an uncharacterized domain shared with the mammalian protein Schlafen
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.256151
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.15639
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATATGT GGGAACTCCA ACGGCGGATT GCGCGCTGGG AAGATATACA TACTGAGTTC 
AAAGAGCAGG ATGTCCATAC CGATGACATT GCTGCGGCGT TGGTGGCTTT TGCCAACACC 
GATGGCGGAC AGTTGATCTT CGGCATCAAT CAAAACCGGG CCATTATCGG CGTTGATGAC 
CCTGATCGCC TGATGCAGCG CGTTGATCAG ATTGCCTGGA ACAACTGCGA GCCGCCGCTC 
ACCGTCCTGC AAGAAACCAT TCGCAGCGAG GAAGGCCGCG TCGTGGTGGT TGTCAACATC 
CCTAAAGGGG ATCAGCGCCC CTATCGTACC ATCAGAGGCG ACTACTTCAT ACGCACCACC 
TCGGGACGCC GACGGGCTTC CCGGCAAGAA CTGCTCCGCC TGTTTCAATC GACGGAGAGT 
CTCTATTACG ATGAGACCGT GGTCTGGCGC GCCACGTTAC GCGATCTGGA CGAACAGCGT 
TTTGCCGATT TCTTCCGGCG GTCCTATAAC CGCGAGATCA CGTCAGAGCA AGAAACAGAG 
CGCCTGATGA AAAACATGCG CTTGCTGGAA GAACGTGAGG GCGCATGGCG TCCCACACTG 
GCGGGCCTGC TCTGCTTCGG ACGAGAGCCG CAGCGATTTC TGCCGTATGC GCAGATCAGC 
GCTGCCCGCA TCCCCGGTGA GACGCTGGCG CTGGCGCCTT CCGATGCCAG GACGATCGGC 
GGCACGTTGT TCGACATGCT GGAAGATGCC GCCCGCTTTC TGCGGATTCA TCTGCGCCGC 
CCGCACGTCA TCCAGGGATT TGAGCCTGAA GAACGCCCGG AGATCCCCGA AGAAGCCTTG 
CGCGAGTTGC TGGTCAACGC GCTGGTGCAT CGCGATTACA CCGTCACTTC TCCGATTCGC 
GTCTTGATCT TCGATGATCG CATCGAAATC CGCACACCGG GCAACCTGCC CAACACAGTT 
ACGATCGAGG CAATTCTTCT GGGCGCTGCG CATGTTTTGC GCAATCCCAT CATCTACACC 
ATGTTCAGTC GCGCCGGACT GGTCACTCAC CTCGGCAGCG GCGTGTTGCG CGCCAGACAA 
CTCATTGAGC AGGACGCGCG CGCCACACTG CGCCTGGAAG TTGTGGCGAA CGAGTTCGTG 
GTTTCTGTTT CCCGTCCCGA AATGTGGCAT GGACCGGGCG GACAGCAATA G

Protein sequence

MDMWELQRRI ARWEDIHTEF KEQDVHTDDI AAALVAFANT DGGQLIFGIN QNRAIIGVDD 
PDRLMQRVDQ IAWNNCEPPL TVLQETIRSE EGRVVVVVNI PKGDQRPYRT IRGDYFIRTT 
SGRRRASRQE LLRLFQSTES LYYDETVVWR ATLRDLDEQR FADFFRRSYN REITSEQETE 
RLMKNMRLLE EREGAWRPTL AGLLCFGREP QRFLPYAQIS AARIPGETLA LAPSDARTIG 
GTLFDMLEDA ARFLRIHLRR PHVIQGFEPE ERPEIPEEAL RELLVNALVH RDYTVTSPIR 
VLIFDDRIEI RTPGNLPNTV TIEAILLGAA HVLRNPIIYT MFSRAGLVTH LGSGVLRARQ 
LIEQDARATL RLEVVANEFV VSVSRPEMWH GPGGQQ