Gene NATL1_04021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_04021
Symbol	rps1a
ID	4781090
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	-
Start bp	371332
End bp	372441
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	38%
IMG OID	640083671
Product	30S ribosomal protein S1
Protein accession	YP_001014231
Protein GI	124025115
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.337887
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAA ATCCAGCAAG CAAAATTGAA GAAAAAAATC CTGAAAAAGA GACATCTATA 
CCTGAAGAAA CTGTTTCAAA TTCCACAAGT GCAGAGTTTG AAGAAAATTC AATTAGTGAA 
TTAAAAGAAG ACGATATTCC CAAAAACATT CCTGCTGCTG ATGACTCTTC AAGCAGAATT 
AATAAGAGTG ATCTTGAAAG TGCAGGTTTC ACACTTGATG AATTCGCATC TTTACTAAGT 
AAATACGACT ACAATTTTAA ACCTGGTGAC ATAGTCAATG GAACAGTTTT TGCTCTTGAA 
TCGAAAGGAG CAATGATTGA CATTGGAGCG AAAACAGCTG CTTTTATGCC TATGCAAGAA 
GTCTCAATAA ATAGGGTCGA GGGTCTGAGT GATGTTTTAC AGCCCTCAGA AATTAGAGAA 
TTTTTTATAA TGACTGAGGA AAATGAGGAT GGTCAATTAT CCTTATCTAT CAGGAGAATT 
GAGTATCAAC GAGCTTGGGA AAGAGTTAGA CAATTACAAA AAGAAGATGC AACAATTTAT 
TCCGAGGTTT TTGCTACAAA TAGAGGCGGT GCACTTGTTC GAGTTGAAGG GCTCAGAGGC 
TTTATTCCTG GATCACATAT AAGCACTAGA AAGGCGAAAG AAGAACTTGT TGCTGATTTC 
TTGCCATTGA AATTCTTAGA AGTTGATGAA GAAAGGAATA GGCTTGTTTT AAGTCATCGC 
AGGGCTTTAG TCGAAAGAAA AATGAATCGC CTTGAAGTTG GAGAAGTTGT TGTAGGAGCA 
GTCAGAGGAA TTAAACCTTA TGGAGCATTT ATAGATATTG GTGGCGTAAG TGGACTTCTT 
CACATCTCTG AAATAAGCCA TGAGCATATT GAAACTCCTC ACTCCGTATT AAATGTCAAT 
GATCAAATGA AGGTCATGAT TATTGATCTA GACGCTGAAA GAGGAAGAAT TTCTCTATCG 
ACGAAAGCGC TTGAACCAGA ACCTGGAGAC ATGCTGACTG ATCCTCAAAA AGTTTTTGAC 
AAGGCTGAAG AGATGGCAGC AAGATACAAA CAAATGCTTC TTGAGCAAGC AGAAGAAGGA 
GAAGATCCTA TTGCAGTAAT GACTATTTGA

Protein sequence

MSENPASKIE EKNPEKETSI PEETVSNSTS AEFEENSISE LKEDDIPKNI PAADDSSSRI 
NKSDLESAGF TLDEFASLLS KYDYNFKPGD IVNGTVFALE SKGAMIDIGA KTAAFMPMQE 
VSINRVEGLS DVLQPSEIRE FFIMTEENED GQLSLSIRRI EYQRAWERVR QLQKEDATIY 
SEVFATNRGG ALVRVEGLRG FIPGSHISTR KAKEELVADF LPLKFLEVDE ERNRLVLSHR 
RALVERKMNR LEVGEVVVGA VRGIKPYGAF IDIGGVSGLL HISEISHEHI ETPHSVLNVN 
DQMKVMIIDL DAERGRISLS TKALEPEPGD MLTDPQKVFD KAEEMAARYK QMLLEQAEEG 
EDPIAVMTI