Gene PMN2A_1689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PMN2A_1689
Symbol
ID	3607091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL2A
Kingdom	Bacteria
Replicon accession	NC_007335
Strand	-
Start bp	356372
End bp	357481
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	38%
IMG OID	637688572
Product	30S ribosomal protein S1
Protein accession	YP_292880
Protein GI	72383525
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.781588
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGAAA ATCCAGCAAG CAAAATTGAA GAAAAAAATC CTGAAAAAGA GACATCTATA 
CCTGAAGAAA CTGTTTCAAA TGCCACAATT GCAGAGTTTG AAGAAAATTC AATTACTGAA 
TTAAAAGAAG ACGATATTCC AAAAAACATT CCTGCTGCTG ATGACTCTTC AAGCAGAATT 
AATAAGAGTG ATCTTGAAAC TGCAGGTTTC ACACTTGATG AATTTGCATC TTTACTAAGT 
AAATACGACT ACAATTTTAA ACCTGGTGAC ATCGTCAATG GAACAGTTTT TGCTCTTGAA 
TCGAAAGGAG CAATGATTGA CATCGGAGCG AAAACAGCTG CTTTTATGCC TATGCAAGAA 
GTCTCAATAA ATAGAGTCGA GGGTCTGAGT GATGTTTTAC AGCCCTCAGA AATTAGAGAA 
TTTTTTATAA TGACTGAGGA AAATGAGGAT GGCCAATTAT CCTTATCTAT CAGGAGAATT 
GAATATCAAC GAGCTTGGGA AAGAGTTAGA CAATTACAAA AAGAAGATGC AACAATTTAT 
TCCGAGGTTT TTGCTACAAA TAGAGGCGGT GCACTTGTTC GAGTTGAAGG GCTCAGAGGA 
TTTATTCCTG GATCACACAT AAGCACTAGA AAGGCGAAAG AAGAACTAGT TGCTGATTTC 
TTGCCATTGA AATTCTTAGA AGTTGATGAA GAAAGGAATA GGCTTGTTTT AAGTCATCGC 
AGGGCTTTAG TCGAGAGAAA AATGAATCGC CTTGAAGTTG GAGAAGTTGT TGTAGGAGCA 
GTCAGAGGAA TTAAACCTTA TGGTGCATTT ATAGACATTG GTGGCGTAAG TGGACTTCTT 
CACATCTCTG AAATAAGCCA TGAGCATATT GAAACTCCTC ACTCCGTATT AAATGTCAAT 
GATCAAATGA AGGTCATGAT TATTGATCTA GACGCTGAAA GAGGAAGAAT TTCTCTATCG 
ACGAAGGCGC TTGAACCAGA ACCTGGAGAC ATGCTGACTG ACCCTCAAAA AGTTTTTGAT 
AAGGCTGAAG AGATGGCAGC GAGATACAAA CAAATGCTTC TTGAGCAAGC AGAAGAAGGA 
GAAGATCCTA TTGCAGTAAT GACTATTTGA

Protein sequence

MSENPASKIE EKNPEKETSI PEETVSNATI AEFEENSITE LKEDDIPKNI PAADDSSSRI 
NKSDLETAGF TLDEFASLLS KYDYNFKPGD IVNGTVFALE SKGAMIDIGA KTAAFMPMQE 
VSINRVEGLS DVLQPSEIRE FFIMTEENED GQLSLSIRRI EYQRAWERVR QLQKEDATIY 
SEVFATNRGG ALVRVEGLRG FIPGSHISTR KAKEELVADF LPLKFLEVDE ERNRLVLSHR 
RALVERKMNR LEVGEVVVGA VRGIKPYGAF IDIGGVSGLL HISEISHEHI ETPHSVLNVN 
DQMKVMIIDL DAERGRISLS TKALEPEPGD MLTDPQKVFD KAEEMAARYK QMLLEQAEEG 
EDPIAVMTI