Gene P9301_03371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9301_03371
Symbol	rps1a
ID	4912480
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9301
Kingdom	Bacteria
Replicon accession	NC_009091
Strand	-
Start bp	308720
End bp	309811
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	36%
IMG OID	640159907
Product	30S ribosomal protein S1
Protein accession	YP_001090561
Protein GI	126695675
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGAAA ATTCTTCTCA AACCATTAAA GAACTTTCTG AGAATCAAGA AATTAAAAAT 
TCGTCTGAGT TAGATAATGA TGCAGCCTCT CAAAATGAGG AGGATTTATC ATTCGAAAAG 
AGCGATATAC CTTCAGCAGA TTCTTCCTCT AGCAGAACAA ATACTGACTT TGACAATGCA 
GGATTTACAC AAGAAGAATT TGCATCACTT TTGGGTAAGT ATGACTATAA CTTTAAGCCT 
GGCGATCTAG TTAAAGGCAC CGTTTTTGCT CTAGAACCCA AAGGGGCCAT GATAGATATA 
GGGGCAAAAA CAGCTGCTTT TATGCCTGTT CAGGAGGTTT CAATAAATAG AGTTGAAGGA 
CTTAATGATG TTTTGCAGCC TTCTGAAAGT AGAGAATTTT TCATAATGAG CGAAGAAAAT 
GAAGATGGCC AATTAGCTCT CTCCATTAGA AGAATTGAAT ATCAAAGAGC ATGGGAAAGG 
GTTAGACAAC TCCAAAAAGA AGATGCCACT ATCTATTCTG AAGTTTTTGC AACAAACAGA 
GGCGGGGCAC TTGTTAGGGT AGAAGGTTTG AGAGGTTTTA TCCCAGGCTC ACATATAAGT 
GCTCGAAAAA TCAAAGATGA CTTAGAAGGT GAATATTTAC CTTTAAAGTT TCTTGAAGTT 
GATGAAGAGA GAAATAGATT AGTACTAAGT CATAGAAGAG CTTTGGTTGA GAAAAAGATG 
AACCGACTTG AGGTAGGAGA AGTTGTTGTT GGTAATGTAA AAGGTATTAA ACCTTATGGA 
GCTTTCATTG ATATTGGTGG AGTTAGTGGT CTATTGCACA TTTCTGAGAT TAGTCATGAA 
CATATTGAGA CTCCTCATAA TGTTTTAAAT GTGAATGACC AAATGAAAGT TATGATAATT 
GACCTTGATT CAGAAAGAGG ACGTATTTCA TTATCTACTA AAGCACTTGA GCCTGAACCA 
GGAGATATGC TAACTGACCC TCAAAAAGTT TTTAGTAAAG CTGAAGAAAT GGCTGCGAAA 
TACAAACAAA TGTTATTTGA ACAAACTGAC GATATTGAAG AGATTCCCAC AGCGTCAAAT 
GAAGCAGAAT AA

Protein sequence

MNENSSQTIK ELSENQEIKN SSELDNDAAS QNEEDLSFEK SDIPSADSSS SRTNTDFDNA 
GFTQEEFASL LGKYDYNFKP GDLVKGTVFA LEPKGAMIDI GAKTAAFMPV QEVSINRVEG 
LNDVLQPSES REFFIMSEEN EDGQLALSIR RIEYQRAWER VRQLQKEDAT IYSEVFATNR 
GGALVRVEGL RGFIPGSHIS ARKIKDDLEG EYLPLKFLEV DEERNRLVLS HRRALVEKKM 
NRLEVGEVVV GNVKGIKPYG AFIDIGGVSG LLHISEISHE HIETPHNVLN VNDQMKVMII 
DLDSERGRIS LSTKALEPEP GDMLTDPQKV FSKAEEMAAK YKQMLFEQTD DIEEIPTASN 
EAE