Gene Cphamn1_2000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphamn1_2000
Symbol	rpsA
ID	6375693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides BS1
Kingdom	Bacteria
Replicon accession	NC_010831
Strand	-
Start bp	2151684
End bp	2153459
Gene Length	1776 bp
Protein Length	591 aa
Translation table	11
GC content	46%
IMG OID	642684492
Product	30S ribosomal protein S1
Protein accession	YP_001960392
Protein GI	189500922
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID	[TIGR00717] ribosomal protein S1

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000749746
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.10797
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGAAA CGCAAACAAT CGAACAAAAG AAGGTAGTTG AGAAAGGGCC TAAAAACCAT 
CATGTGAAGT TTTTCGCAAA CTACGACTCT TCGGAACTTG ACCAGATGGA GCTGCTCTAT 
TCGAGCACGC TTAACGAGAT TACCGAAGAG GAAATCGTTA AAGGTACTAT TGTCGCCATT 
TCGAACAAGG ATGTTACCAT TGATGTCGGA TTTAAATCCG AGGGTATCGT TTCGAAGCTT 
GAGTTCAAGG ACGAAGAAGA GCTGCAAGTC GGTGACGAGG TAGAAGTATA CCTCGAAAAC 
ATCGAAGACA AAATGGGACA GCTTATTCTC TCGAAGAGAA AAGCGGACGT TCTGAGGATC 
TGGGACAAAA TCTATGATTC CATCGAGAAC GACACCATTA TCAACGGAAA GATAATTAAC 
CGTGTCAAGG GCGGTATGAC GGTTTCGCTT TCCGGAGTCG AGGCATTTCT TCCGGGTTCG 
CAGATCGACG TCAAACCTGT GCGCGACTTC GATGCGCTCG TAGGACAGAC AATGGACTTC 
AGAGTGGTAA AAATCAATCC TGTGACACAG AATATCGTTG TCAGTCACAA GGTTATTCTC 
GAAGAAGAGT ACGCCGCGAA GCGCGAAGAG ATGCTTGCCA ATATCAAGGT GGGTATGATT 
CTCGAGGGTT CAGTAAAGAA TATCACCGAT TTCGGTATTT TTGTCGACCT TGGCGGTCTC 
GACGGGCTTG TTCATATTAC CGATATCACC TGGGGCAGGA TCAATCATCC TTCAGAAGTT 
GTCGACCTTG ATCAGCCGAT CAAAGTTGTT GTTGTTGCTT TTGACGAAAA TACCAAGAGG 
GTCTCTCTCG GGATGAAGCA GCTTGAATCT CATCCTTGGG AAAATATCGA GATCAAGTAC 
CCTGTAGGCA TCAAAACGAA CGGTCGAGTT GTTTCCATTA CTGATTACGG CGCATTTGTC 
GAGATAGAAA AAGGTATTGA AGGCCTTGTT CACATCTCTG AAATGAGCTG GACTCAGCAC 
ATCAAGCATC CAAGCCAGTT TGTTACTCTC GGTCAGGAAG TTGAATGTGT TATCCTCAAT 
GTCGATAAAG AGCACACCAA GCTATCGCTT TCCATGAAGC GGGTGAACGA AGATCCATGG 
ATCGCTCTTT CAGAAAAATA TATCGAGAAT TCCCTGCACA AAGGTACAGT CAGCAACATT 
ACCGATTTCG GTGTTTTTGT CGAGCTTGAG CCCGGAGTCG ATGGCCTTGT GCACATTTCA 
GATCTCTCCT GGACGAAGAA GATTCGCCAC CCGAGTGAAC TGGTCAAAAA GAATCAGGAC 
CTTGAGGTAA AAGTGTTGAA ATTTGATGTC AACGCCCGCC GAATCGCGCT TGGTCACAAG 
CAGATCAACC AGGATCCGTG GGATGAATTC GAACAGAAAT ATGCGGTCGG GGCGGAGTGT 
GCCGGAAAAA TATCGCAGAT CATAGAAAAA GGCGTTATCG TTATCCTTCC TGGTGACGTT 
GACGGTTTTG TTCCGGTATC GCATCTTCTT CAGGGTGGCG TTAAGGACAT TAACGCATCC 
TTCAAGGTTG AAGATGAACT GCCGCTTCGT GTTATCGAGT TCGATAAGGA AAACAAACGG 
ATTATTCTCT CGGCGCTCGA ATATTTCAAA GATAAGAGCA AAGAGGAGAT TGAAGCCTAC 
CTTCAGGCTC ATCCGAATGA AAAGAAAGAG ATTGAGGATG CCACTGCCGA GCTGGATTCA 
CAATCAAATA CCGATGACGC TAAAGACGGC GAGTAA

Protein sequence

MSETQTIEQK KVVEKGPKNH HVKFFANYDS SELDQMELLY SSTLNEITEE EIVKGTIVAI 
SNKDVTIDVG FKSEGIVSKL EFKDEEELQV GDEVEVYLEN IEDKMGQLIL SKRKADVLRI 
WDKIYDSIEN DTIINGKIIN RVKGGMTVSL SGVEAFLPGS QIDVKPVRDF DALVGQTMDF 
RVVKINPVTQ NIVVSHKVIL EEEYAAKREE MLANIKVGMI LEGSVKNITD FGIFVDLGGL 
DGLVHITDIT WGRINHPSEV VDLDQPIKVV VVAFDENTKR VSLGMKQLES HPWENIEIKY 
PVGIKTNGRV VSITDYGAFV EIEKGIEGLV HISEMSWTQH IKHPSQFVTL GQEVECVILN 
VDKEHTKLSL SMKRVNEDPW IALSEKYIEN SLHKGTVSNI TDFGVFVELE PGVDGLVHIS 
DLSWTKKIRH PSELVKKNQD LEVKVLKFDV NARRIALGHK QINQDPWDEF EQKYAVGAEC 
AGKISQIIEK GVIVILPGDV DGFVPVSHLL QGGVKDINAS FKVEDELPLR VIEFDKENKR 
IILSALEYFK DKSKEEIEAY LQAHPNEKKE IEDATAELDS QSNTDDAKDG E