Gene Clim_0349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0349
Symbol	rpsA
ID	6354343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	385593
End bp	387353
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	49%
IMG OID	642667979
Product	30S ribosomal protein S1
Protein accession	YP_001942421
Protein GI	189345892
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID	[TIGR00717] ribosomal protein S1

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000000135822
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAGAAA CACTATCGCT GGAGAAGAAA GTCCAGGAAA GGCCCGCAAG GAAAAAAGTC 
AAAGTTTTCG CTCACTACGA TTCCGCGGCA CTTGCCGAGA TGGAAAAGCT CTATACGAGT 
ACGCTGAGCG AAATCAGGGA AGACGAGATC GTCAAGGGCC GTATCGTCTC CATTTCCAAC 
AAGGACGTCA CCATTGACGT CGGTTACAAG TCAGAGGGTA TTGTCTCACT GCTTGAATTC 
CGTGACGAAG AAGAGGGAGA AGTCAAGGTT GGCGATGAAG TAGAGGTTTA TCTCGAAAAC 
ATCGAAGACA AAATGGGGCA GCTCATTCTT TCCAAGAAGA AAGCTGACGT TCTGAGAATC 
TGGGACAAGA TCTACGATTC AATTGAAAAC GACACGATCA TCAACGGCAA GATCATCAAC 
CGCGTCAAGG GCGGTATGAC TGTCTCCCTG TCCGGTGTTG AAGCCTTCCT TCCCGGTTCG 
CAGATCGATG TCAAGCCTGT TCGTGATTTC GATGCCCTGG TCGGTCAGAC TATGGATTTC 
AGGGTTGTCA AAATCAATCC CGTTACTCAG AATATTGTTG TCAGTCACAA GGTCATCCTC 
GAAGAGGAGT ATGCAGCACG CCGTGAAGAG ATGCTTGCCA ATATCAAGGT TGGTATGGTG 
CTCGAAGGTA CGGTCAAAAA TATCACCGAC TTCGGTATTT TTGTCGATCT TGGCGGTCTC 
GACGGTCTGG TGCATATCAC CGATATTACC TGGGGCAGAA TCAACCATCC GTCGGAAGTC 
GTCGAACTTG ATCAGCCGAT CAAGGTTGTT GTTGTCGGCT TCGATGAGAA CACCAAGCGT 
GTCTCTCTCG GCATGAAGCA GCTTGAGTCT CATCCGTGGG AAAACATCGA ACTTAAATAT 
CCTGTCGGAT CCAAAGCGAA CGGCCGTGTG GTTTCCATTA CCGATTACGG CGCATTTGTC 
GAGATCGAGA AAGGTATTGA GGGACTTGTC CACATTTCCG AAATGAGCTG GACGCAGCAC 
ATCAAACATC CGGGTCAGTT CGTTACTCTC GGTCAGGAGG TTGAGTGTGT GATTCTCAAT 
ATCGATAAAG AGCACACCAA GCTTTCGCTC TCCATGAAAC GGGTGAACGA AGACCCCTGG 
ATCGCGCTTT CAGAAAAATA TATCGAGAAT TCATTGCATA AAGGCACGGT CAGCAACATC 
ACCGATTTTG GTGTATTTGT TGAGCTTGAA GCCGGAGTTG ACGGTCTGGT GCACATCTCC 
GATCTGTCAT GGACGAAGAA AATCCGCCAT CCGAGCGAAC TGGTCAAGAA AAACCAGGAA 
CTGGAAGTCA AGGTGCTGAA ATTTGACGTC AATGCTCGCC GTATCGCTCT CGGTCACAAG 
CAGATCAATC CTGATCCGTG GGATGAGTTC GAGCAGAAGT ATGCCGTAGG CGCCGAAACT 
CCGGGAAATA TCTCACAGAT CATCGAGAAG GGTGTCATTG TCATTCTGCC CGGCGATGTT 
GACGGTTTTG TGCCGGTATC GCATCTGCTT CAGGGCGGCG TGAAGGATAT TCACTCCTCG 
TTCGCTGTGG ATAATGAACT TCCGCTTCGC GTGATCGAGT TCGACAAAGA GAACAAAAGG 
ATCATTCTTT CGGCTCTCGA ATATTTCAAG GACAAGAGCA AGGAGGAGAT CGAAGCATAT 
CTTCAGGCTC ATCCGAACGA AAAGAAAGAG ATCGAGGATG CTACCGCAGA GCTGGAGCCT 
CAGCCGAAAG GCAGCAAGTA A

Protein sequence

MPETLSLEKK VQERPARKKV KVFAHYDSAA LAEMEKLYTS TLSEIREDEI VKGRIVSISN 
KDVTIDVGYK SEGIVSLLEF RDEEEGEVKV GDEVEVYLEN IEDKMGQLIL SKKKADVLRI 
WDKIYDSIEN DTIINGKIIN RVKGGMTVSL SGVEAFLPGS QIDVKPVRDF DALVGQTMDF 
RVVKINPVTQ NIVVSHKVIL EEEYAARREE MLANIKVGMV LEGTVKNITD FGIFVDLGGL 
DGLVHITDIT WGRINHPSEV VELDQPIKVV VVGFDENTKR VSLGMKQLES HPWENIELKY 
PVGSKANGRV VSITDYGAFV EIEKGIEGLV HISEMSWTQH IKHPGQFVTL GQEVECVILN 
IDKEHTKLSL SMKRVNEDPW IALSEKYIEN SLHKGTVSNI TDFGVFVELE AGVDGLVHIS 
DLSWTKKIRH PSELVKKNQE LEVKVLKFDV NARRIALGHK QINPDPWDEF EQKYAVGAET 
PGNISQIIEK GVIVILPGDV DGFVPVSHLL QGGVKDIHSS FAVDNELPLR VIEFDKENKR 
IILSALEYFK DKSKEEIEAY LQAHPNEKKE IEDATAELEP QPKGSK