Gene Rcas_0934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0934
Symbol
ID	5538400
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	1239605
End bp	1240771
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	60%
IMG OID	640893083
Product	RNA-binding S1 domain-containing protein
Protein accession	YP_001431066
Protein GI	156740937
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID	[TIGR00717] ribosomal protein S1

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000731277
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.167396
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGCAG TACCCGACAA TGCCGTCCAG GAAACAGAAG ATTTCGATTG GACGCAGATG 
CTCGACGACT ACGACTATGC GCGTCCGCAA CGCGGCGAGG TGCGCGAGGG CGTGGTCATG 
AAGATTGAAG ACGGCGGTAT TCTGGTCTCG ATTGGCACCA AGCGCGAAGG GATCATTCCG 
ATTGCCGACG TGCGCGCTAT CGGCGATGAG GTGTTGAACA ACCTGAAGGT GGGCGATCGG 
ATTCAGGTGT ACGTTCAGGA CCCGGAGAAT CGCCAGGGCG ATCTGGTCTT GTCGCTGACG 
ATGGTACAAG TTGCGCGCGA TTGGGAAGAA GCGGCTCGCC TGAGCGCTGA GGGCGGCATT 
GTGCAGGGCC AGGTTATTGG CTACAACAAA GGTGGCTTGC TGGTACAGTT CAATCGCATT 
CGTGGGTTTG TGCCGGCATC TCAGGTGGCG CAACTCCATG GACGCACTGC TGCCGAGGAA 
CGGCAGCAGG CGTTGCAACG CATGGTTGGT CAGACCATCC CGCTGAAGGT GATCGAGGTG 
GATCGTGATC GCAATCGGTT GGTGCTATCG GAGCGCAGCG CAACGCAGGA GTGGCGCAAG 
GCGCAGAAGC AGCGTCTGCT TACGGAACTT CAGCCGGGCG ATATTTTGAC CGGGCGCGTC 
AATCAACTGA CGAACTTCGG CGCATTCATC GATCTCGGCG GCGCCGATGG TCTGGCGCAT 
ATCTCCGAAT TGTCGTGGCA GCGCGTCAAC CATCCCCGCG AGGTGCTGTC GCCAGGGCAG 
GAAGTGAGGG TCATGGTCGT GGAGATCGAT GCCGAACGTG AACGCATTGG TCTCAGCCTG 
CGCCGCCTTC AACCCAATCC ATGGGATACA ATCGATCAGC GCTACTCGCT TGGACAACTC 
GTGAGCGGTC CGGTGACGAA CGTTGCACCG TTTGGCGCAT TTGTGCAGAT AGAAGAGGCG 
GTCGAAGGTC TGATCCACGC CAGCGAACTC GACGCCGATC CGCAGGCGCA GCCGCGCGAT 
CTGTTGCAGC CCGGTCAGAT CATCACGGCC CGAATTATCA GCCTCGATAA GCAGCGCCAG 
CGTATGGGGC TTAGCCTGCG CCGCAACAGC GCCGATGAAC CGCCGCCGGA GGAGACGCCG 
GTTGAGGCGC CGTCCACCGA TATGTAA

Protein sequence

MKAVPDNAVQ ETEDFDWTQM LDDYDYARPQ RGEVREGVVM KIEDGGILVS IGTKREGIIP 
IADVRAIGDE VLNNLKVGDR IQVYVQDPEN RQGDLVLSLT MVQVARDWEE AARLSAEGGI 
VQGQVIGYNK GGLLVQFNRI RGFVPASQVA QLHGRTAAEE RQQALQRMVG QTIPLKVIEV 
DRDRNRLVLS ERSATQEWRK AQKQRLLTEL QPGDILTGRV NQLTNFGAFI DLGGADGLAH 
ISELSWQRVN HPREVLSPGQ EVRVMVVEID AERERIGLSL RRLQPNPWDT IDQRYSLGQL 
VSGPVTNVAP FGAFVQIEEA VEGLIHASEL DADPQAQPRD LLQPGQIITA RIISLDKQRQ 
RMGLSLRRNS ADEPPPEETP VEAPSTDM