Gene A9601_03361 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_03361
Symbol	rps1a
ID	4717024
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	-
Start bp	309140
End bp	310231
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	37%
IMG OID	640078039
Product	30S ribosomal protein S1
Protein accession	YP_001008731
Protein GI	123967873
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGAAA ATTCTTCCCA AACCATTAAA GAAATTTCTG AGGATCAAGA AATTAAAAAT 
TCGTCTGAGT TAGATAATAA TTCAGCATCT CAAAATGAGG AAGATTTATC ATTCGAGAAG 
AGCGATATAC CTCAAGCAGA TTCTTCCTCT AGCAGAACCA ATACGGATTT TGACAACGCA 
GGATTCACTC AAGAAGAATT TGCATCACTT TTGGGTAAGT ATGACTATAA CTTTAAGCCT 
GGCGATCTAG TTAAAGGTAC CGTTTTTGCT CTAGAGCCCA AAGGGGCCAT GATAGATATA 
GGGGCAAAAA CAGCTGCTTT TATGCCTGTT CAGGAGGTTT CAATAAATAG AGTTGAAGGA 
CTTAATGATG TTTTACAACC TTCAGAAAGT AGAGAATTTT TCATAATGAG CGAAGAAAAT 
GAAGATGGCC AGTTAGCCCT CTCCATTAGA AGAATTGAAT ATCAAAGAGC ATGGGAAAGG 
GTTAGACAAC TCCAAAAAGA AGATGCCACT ATATATTCTG AAGTTTTTGC AACAAACAGA 
GGTGGGGCTC TTGTGAGAGT GGAGGGCTTG AGAGGCTTTA TCCCAGGCTC ACACATAAGT 
GCACGAAGAA TTAAAGATGA CTTAGAAGGT GAATATTTAC CTTTAAAATT TCTTGAAGTC 
GATGAAGAGA GAAACAGATT AGTACTAAGC CATAGAAGAG CTTTGGTTGA GAAAAAAATG 
AACCGACTCG AGGTAGGCGA AGTTGTTGTT GGTTCTGTAA AAGGTATTAA ACCTTATGGG 
GCCTTTATTG ATATTGGTGG AGTTAGTGGT CTATTGCATA TTTCTGAGAT TAGTCATGAA 
CATATTGAAA CTCCGCATAA TGTTTTAAAT GTGAGTGACC AAATGAAAGT GATGATAATT 
GACCTTGATT CAGAAAGAGG ACGAATTTCA TTATCTACTA AAGCACTTGA ACCTGAACCA 
GGAGATATGC TAACTGACCC TCAAAAAGTT TTTAGTAAAG CTGAAGAAAT GGCTGCTAAA 
TATAAACAAA TGTTATTCGA ACAGACTGAC GAGAACGAAG AGATCGCCAC AGCTTCAGCT 
GAAACACTAT AA

Protein sequence

MNENSSQTIK EISEDQEIKN SSELDNNSAS QNEEDLSFEK SDIPQADSSS SRTNTDFDNA 
GFTQEEFASL LGKYDYNFKP GDLVKGTVFA LEPKGAMIDI GAKTAAFMPV QEVSINRVEG 
LNDVLQPSES REFFIMSEEN EDGQLALSIR RIEYQRAWER VRQLQKEDAT IYSEVFATNR 
GGALVRVEGL RGFIPGSHIS ARRIKDDLEG EYLPLKFLEV DEERNRLVLS HRRALVEKKM 
NRLEVGEVVV GSVKGIKPYG AFIDIGGVSG LLHISEISHE HIETPHNVLN VSDQMKVMII 
DLDSERGRIS LSTKALEPEP GDMLTDPQKV FSKAEEMAAK YKQMLFEQTD ENEEIATASA 
ETL