Gene Rcas_2015 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2015
Symbol
ID	5539493
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2582455
End bp	2583690
Gene Length	1236 bp
Protein Length	411 aa
Translation table	11
GC content	58%
IMG OID	640894150
Product	RNA-binding S1 domain-containing protein
Protein accession	YP_001432121
Protein GI	156741992
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID	[TIGR00717] ribosomal protein S1

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0652883
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACAGC AAGAACAGGC TGCCACAAAC CATCAACAGA CGAACGCTGC CCAATCGTTC 
GGCGACGCTG CGAATGGCCA GTCAGCCGAT CAGCGTGACG ACCGGGAATT GATGGAGCAG 
TTCCTCGCCA ACCCTGCTCA CGACTACCGC AATCTTCAAT ATGGTGATAC GGTCGATGGC 
ATCATCATGC GCGTCGGTCG CGATGAGATT CTGGTCGACA TCGGCGCCAA AGCCGAGGGT 
GTGGTGCCGG CCAGAGAGAT GCAGTCGCTC TCTGACGATG ATCGAGCGGC GTTGAAACCG 
GGCGATCCGC TGCTGGTCTT TGTTGTTCAA TCCGAGGACA AAGAAGGTCG AGCGACGCTC 
TCGATCGATC GGGCGCGTCA GGAGAAGAGT TGGCGTCGCT TACAGCAGTG TTATGAGACC 
GGCGAGATTA TCGAAGCAAA AGTGATTAAC TACAACAAAG GTGGGCTGCT TGTCAATCTC 
GATGGTGTGC GCGGATTTGT GCCTTCCTCG CAGGTCAGCG GCATCGGTCG CGGCTCCGAG 
GCGCAGAAGC AGTCGGAGAT GGCGCGCATG GTGGGGCAGA CGCTGGCGTT GAAGGTGATC 
GAGATCAATC GTAATCGCAA TCGGTTGATC CTCTCGGAAC GCCAGGCTGC AATGGATGTG 
CGCGAAGGGC GCAAAGGTGA GTTGCTGTCG GCGCTGAAAG AAGGCGATGT TCGGGAGGGC 
GTCGTCACAT CCGTTTGTGA CTTCGGCGCG TTTGTCGATA TAGGCGGCGC CGATGGGTTG 
GTGCATCTTT CGGAACTTTC CTGGAGCCGG GTCAAGCATC CGAGCGAGAT TCTGAAGCCG 
GGTGACAAAG TGCAGGTGTA TGTGCTCAGT ATCGATAATG AGCGTAAACG GATTGCGCTC 
TCGCTGAAGC GTACCCAGCA CGAGCCGTGG GCCACGGTTG GCGAGCGGTA TCACATTGGC 
CAGATGGTTG AGGGTGTCGT GACGCAACTG GCGCCGTTCG GCGCATTCGT GCGGATTGAG 
GACGGGGTTG AAGGGCTGAT CCATGTGTCT GAAATGGGTG ATGGACGGGT CCAGCATCCG 
CGCGATGTGT TGCAGGAAGG CGATGCGGTC CAGGCACGCA TCATCCGTAT CGATCCGGCG 
CGGAAGCGCA TCGGTTTGAG CATGCGCCAG TCATCCGACG ATCAGATCGC GCATCAGTCA 
TCCGACAAAG AAGAGGAGTC TGATGCTGAC GAGTGA

Protein sequence

MEQQEQAATN HQQTNAAQSF GDAANGQSAD QRDDRELMEQ FLANPAHDYR NLQYGDTVDG 
IIMRVGRDEI LVDIGAKAEG VVPAREMQSL SDDDRAALKP GDPLLVFVVQ SEDKEGRATL 
SIDRARQEKS WRRLQQCYET GEIIEAKVIN YNKGGLLVNL DGVRGFVPSS QVSGIGRGSE 
AQKQSEMARM VGQTLALKVI EINRNRNRLI LSERQAAMDV REGRKGELLS ALKEGDVREG 
VVTSVCDFGA FVDIGGADGL VHLSELSWSR VKHPSEILKP GDKVQVYVLS IDNERKRIAL 
SLKRTQHEPW ATVGERYHIG QMVEGVVTQL APFGAFVRIE DGVEGLIHVS EMGDGRVQHP 
RDVLQEGDAV QARIIRIDPA RKRIGLSMRQ SSDDQIAHQS SDKEEESDAD E