Gene P9211_03471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9211_03471
Symbol	rps1a
ID	5731488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9211
Kingdom	Bacteria
Replicon accession	NC_009976
Strand	-
Start bp	327371
End bp	328486
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	39%
IMG OID	641284695
Product	30S ribosomal protein S1
Protein accession	YP_001550232
Protein GI	159902888
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTGAAA ACTCACCTGA GGCTTCACAA AAGCTAGAGA CAGAAGAACA GGCAGCTAAG 
AGTATTGATG AGAGTCAAAC CTCTTCACCA GAAATTAATA ACAAGACTCC TGAAGAAACA 
GGTAACCAAG TAGACACAGA TATTCCTGAA GATATCCCAA CAGCAGATGA TCCTTCTAGC 
AGAGTAAAAA AACACGATTT TGATGGAGTA GGTTTTACTC TTGAAGAGTT TGACTCACTT 
TTAAGCAAAT ACGATTACAA CTTCAAGCCT GGCGACATTG TCAATGGAAC AGTTTTTGCT 
CTTGAAACAA AGGGAGCGAT GATTGATATA GGAGCAAAAA CGGCAGCTTT CATGCCAATG 
CAAGAAGTAT CCATTAATCG TGTTGAAGGT TTAAGCGATG TACTCCAACC TTCAGAAGTA 
AGACAATTTT TTATAATGAG TGAAGAGAAT GAAGATGGTC AACTTTCACT TTCTATCCGG 
AGGATTGAAT ATCAGCGCGC ATGGGAAAGA GTGAGACAAC TTCAAAAGGA AGATGCAACT 
ATTTACTCAG AAGTATTTGC AACAAATAGA GGCGGAGCAC TTGTAAGAGT AGAAGGACTT 
AGAGGCTTTA TACCTGGTTC TCATATTAGT ACTAGGAAAG CTAAAGAAGA ATTAGTCGCA 
GAGTTCTTAC CACTAAAGTT TTTAGAAGTT GACGAAGAGA GAAATAGATT AGTACTAAGT 
CATAGGCGTG CCTTAGTCGA AAGAAAAATG AATCGATTAG AAGTTGGTGA AGTTGTTGTT 
GGTGCTGTGA GAGGAATAAA ACCATATGGA GCTTTCATAG ATATAGGAGG GGTAAGTGGA 
CTGCTTCATA TCTCGGAAAT TAGCCATGAA CATATTGAAA CCCCTCATTC AGTTCTAAAT 
GTCAATGATC AGATGAAAGT GATGATTATT GACCTAGATG CAGAGAGAGG ACGTATTTCT 
CTTTCGACAA AAGCACTTGA GCCTGAGCCT GGGGATATGC TGAGCGACCC ACAGAAAGTA 
TTTGACAAAG CCGAAGAAAT GGCTGCTAAA TACAAGGAAA TGTTACTTGA GCAAGCAGAG 
GAAGGTGAAA ACCCAATAGC AACAATGGAA ATTTAG

Protein sequence

MVENSPEASQ KLETEEQAAK SIDESQTSSP EINNKTPEET GNQVDTDIPE DIPTADDPSS 
RVKKHDFDGV GFTLEEFDSL LSKYDYNFKP GDIVNGTVFA LETKGAMIDI GAKTAAFMPM 
QEVSINRVEG LSDVLQPSEV RQFFIMSEEN EDGQLSLSIR RIEYQRAWER VRQLQKEDAT 
IYSEVFATNR GGALVRVEGL RGFIPGSHIS TRKAKEELVA EFLPLKFLEV DEERNRLVLS 
HRRALVERKM NRLEVGEVVV GAVRGIKPYG AFIDIGGVSG LLHISEISHE HIETPHSVLN 
VNDQMKVMII DLDAERGRIS LSTKALEPEP GDMLSDPQKV FDKAEEMAAK YKEMLLEQAE 
EGENPIATME I