Gene Rcas_1422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1422
Symbol
ID	5538895
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	1817226
End bp	1818737
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	65%
IMG OID	640893559
Product	RNA-binding S1 domain-containing protein
Protein accession	YP_001431535
Protein GI	156741406
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.324209
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGATC AGGAGCGTCC CGTCGAAGAG CGGAATGAAC TGCTGGGCGA TTCGGCGCCG 
ACTGCGGCAG GCGTTGCGGT GGCGGACGCG GAAACTCAGC AGCAGTCGAT AGAGTCTCCC 
CCTGTTGGGG AAACGCCGGA TGGCGCCGGG GCGGCAGCGG ATGTGAGCGA CGTGGCGGTG 
TCGTCTGATG GCGGCGATAG CCGCGAATCC GTCCGCGCCG CCGATGAGTC GCCGGCTGCG 
GTGGCGGAAA GCGCCTCGGA AGCGCCGGTT CCTGCTGCTG AAACGCCGCC GACCGGGAGC 
GCCGAAGTCG CGCCGGAAGC GGCGGCGCCT GCCGGTACTG CCGAAGCCGC AAGTTATCAG 
GCGCCGGCTG AAGCGCCAAC CGGACGCCCG CGACGGGTGA AGGACCTGGC GCCCGGTATG 
GAACTGGAAG GACGGGTCAC CTCGATTGCG CTCTACGGCA TCTTCGTTGA TATTGGCGTC 
GGGCGCGACG GTCTGGTGCA TATTTCGGAG ATGAGCGACA CCCGTATCGA ATCGCCGAGT 
GATCTGGTCA AGATTGGCGA TACGGTGAAG GTGCGGGTAA AGAGCGTCGA ACCCGATGGT 
CGCCGGATCA GCCTGACGAT GCGCATGAAG GAGCGGGGCG CGGAACCGCG CAGTGGTCGC 
GGCAAAAAGA AGCCCGAGGT GGATTACGAT AAACTTGCTG CGCTGCGCGT CGGCGATAAT 
GTCGAGGGGA CGGTGACCGG GCTGGCGCCG TTTGGCGTGT TCGTCGATAT TGGCGTCGGC 
AAGGATGGGC TGGTGCATGT GTCGGAACTG GCGGAAGGGC GCGTCGAAAA GGCTGAGGAT 
GTCGTGCAGG TTGGTCAGAC CTATACCTTC AAGGTGCTGG AAGTCGATGC CGAGGGCGCT 
CGCATCAGCC TGAGTCTGCG CCGGGCGCAG CGTGGTCAAA AGTTGCAGCA ACTGGAGAAG 
GGGCAGATTC TCGAAGGCAC GATCAGCGGT CTGGCGCCGT TTGGCGCGTT CGTCGATATT 
GGCGTCGGGC GCGACGGGCT GGTGCATATT TCTGAGTTGT CGAACGCGCG TGTGGCGCGC 
GTCGAAGATG CGGTCAAGGT TGGCGATAAG GTGCAGGTGC GGGTGCTCGA TGTCGATCCG 
CAGAGCAAAC GGATCAGCCT GAGCCTGCGG CTGGAGGATA CGCCGCGCGA GCCGCCGCCG 
CGTGAGGAAC GACCGCGTGA GGAACGACCG CGGGAAGAGC GACCGCGCAT GGAGCGCGCA 
GTGCGCAGCG AAGGGCGCCC GCCGCGTGAA GAGCGCCCGC CGCGGCGTGA GCGTGTCAGC 
GATGCCTACT CCCCGGAGGA GGATGATTTT GGTGGGAATG CCACCCTCGA CGATTTGATG 
TCGAAGTTCG GCGGACCGCG CCGCAGTGAG CGTCGCCGCC GCCAGGACGA TGACGATGAT 
GTGGAAGACC GGAGTCTCCG CCGCCAGCGC GACGCTATTC GTCGCACGCT CCAACAACTC 
GACGACGATT GA

Protein sequence

MTDQERPVEE RNELLGDSAP TAAGVAVADA ETQQQSIESP PVGETPDGAG AAADVSDVAV 
SSDGGDSRES VRAADESPAA VAESASEAPV PAAETPPTGS AEVAPEAAAP AGTAEAASYQ 
APAEAPTGRP RRVKDLAPGM ELEGRVTSIA LYGIFVDIGV GRDGLVHISE MSDTRIESPS 
DLVKIGDTVK VRVKSVEPDG RRISLTMRMK ERGAEPRSGR GKKKPEVDYD KLAALRVGDN 
VEGTVTGLAP FGVFVDIGVG KDGLVHVSEL AEGRVEKAED VVQVGQTYTF KVLEVDAEGA 
RISLSLRRAQ RGQKLQQLEK GQILEGTISG LAPFGAFVDI GVGRDGLVHI SELSNARVAR 
VEDAVKVGDK VQVRVLDVDP QSKRISLSLR LEDTPREPPP REERPREERP REERPRMERA 
VRSEGRPPRE ERPPRRERVS DAYSPEEDDF GGNATLDDLM SKFGGPRRSE RRRRQDDDDD 
VEDRSLRRQR DAIRRTLQQL DDD