Gene Rcas_1606 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1606
Symbol
ID	5539082
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2069909
End bp	2071069
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	56%
IMG OID	640893743
Product	putative transcriptional regulator
Protein accession	YP_001431716
Protein GI	156741587
COG category	[K] Transcription
COG ID	[COG2865] Predicted transcriptional regulator containing an HTH domain and an uncharacterized domain shared with the mammalian protein Schlafen
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.906529
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGTTT TAGAACTCTA TCAACGTATC CAACGTTGGG AGGATTTGCA TACCGAGTTC 
AAAGAGCAGG ATGCGCACTC CGATGATATC GCCGCCGCGC TGGTCGCTTT TGCCAACACT 
GATGGCGGTC AACTGATTTT CGGCGTCAGC AAGGACCGGG TTATCATCGG CGTGGATGAT 
GCGGACCGTG TGATGCAACG CATTGACCAG ATTGCTTACC ATAATTGCGA GCCTCCCGTC 
ACCGTGATTC AGGAAACGAT TCCCACAGAA CAGGGCCTCG CGGTTGTTGT GAACATCCCC 
AAGGGCGACC AGCGTCCCTA TCGCACGCAG CGGGGAGACT ATTTCATTCG CACCACCTCC 
GGGCGCCGGC GCGCTTCCAG ACAAGAACTG TTGCGCCTCT TCCAGTCGGT CGAAAGCCTG 
TACTATGACG AAACGCTGGT GTTACGCGCA AGCCTTTCGG ATCTGGACTA TCGGCGCTTC 
ACGGTGTTTT TTGAACAATC CTATCAAAGG CTTTTGCAGT CTGAGCAAGA GGTAGAGAAT 
CTGCTGCGAA ACATGCGCCT GGTCAGGGAA CAGGCAGGCG TCTGGCATCC GACCCTGGCA 
GGTCTGCTTT GCTTTGGCCG CGAGCCGCAA AGTTTCTTCC CCTACGCACA GGTCAACGCG 
GCGCGTATCC CCGGCGACTC GCTTGCCACC GCGCCATCGG ATGCCAAGCA AATCGGCGGT 
ACCCTGTTTG ATATGTTGGA AGACACGGCG CGTTTTTTGC AGATTCATCT GCCCAGCCCG 
CACATCATTC ACGGCTTTGC GCCCGAGCAA CGGACTGAAA TTCCCGAAGA AGCCCTGCGC 
GAGTTGTTGG TCAATGCCCT GGTCCACCGC GATTACACCG TTGCGTCGCC CATCCGTCTG 
CTGATTTTTG ACCGGCGGAT CGAAATCCGC ACGCCGGGCG CGTTGCCGAA TACGGTCACC 
ATCGAAGCTA TTTTGTTGGG GGCGGCGCAT GTGCTTCGCA ATCCCACCAT TTATACGATG 
TTCAGCCGGG CCGGCCTGGT CACGAGTTTG GGCAGCGGCG TTTTACGTGC CAAAGAACTC 
CTTGAACAGC ACGCTCACAC AACCCTCGAA CTAAAAGTTG TCGCCAATGA ATTTGTCGTG 
ATCATCACTC GTCCGGGGTG A

Protein sequence

MDVLELYQRI QRWEDLHTEF KEQDAHSDDI AAALVAFANT DGGQLIFGVS KDRVIIGVDD 
ADRVMQRIDQ IAYHNCEPPV TVIQETIPTE QGLAVVVNIP KGDQRPYRTQ RGDYFIRTTS 
GRRRASRQEL LRLFQSVESL YYDETLVLRA SLSDLDYRRF TVFFEQSYQR LLQSEQEVEN 
LLRNMRLVRE QAGVWHPTLA GLLCFGREPQ SFFPYAQVNA ARIPGDSLAT APSDAKQIGG 
TLFDMLEDTA RFLQIHLPSP HIIHGFAPEQ RTEIPEEALR ELLVNALVHR DYTVASPIRL 
LIFDRRIEIR TPGALPNTVT IEAILLGAAH VLRNPTIYTM FSRAGLVTSL GSGVLRAKEL 
LEQHAHTTLE LKVVANEFVV IITRPG