Gene SNSL254_A1014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1014
Symbol	rpsA
ID	6486393
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1026270
End bp	1027943
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	51%
IMG OID	642736420
Product	30S ribosomal protein S1
Protein accession	YP_002040179
Protein GI	194444412
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID	[TIGR00717] ribosomal protein S1

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.535746
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGAAT CTTTTGCTCA ACTCTTTGAA GAATCCTTAA AAGAAATCGA AACCCGCCCG 
GGTTCCATCG TTCGTGGTGT TGTTGTTGCT ATCGACAAAG ACGTAGTACT GGTTGACGCC 
GGTCTGAAAT CTGAGTCTGC CATTCCGGCT GAGCAGTTCA AAAACGCCCA GGGCGAACTG 
GAAATCCAGG TTGGTGACGA AGTTGACGTT GCTCTGGATG CAGTAGAAGA CGGCTTCGGT 
GAAACTCTGC TCTCTCGTGA GAAAGCTAAA CGTCACGAAG CATGGATCAC GCTGGAAAAA 
GCTTACGAAG ATGCTGAAAC TGTTACCGGT GTTATCAACG GCAAAGTTAA GGGTGGCTTC 
ACTGTTGAGC TGAACGGTAT TCGCGCGTTC CTGCCAGGTT CTCTGGTAGA CGTTCGTCCG 
GTGCGTGACA CTCTGCACCT GGAAGGCAAA GAGCTTGAAT TCAAAGTAAT CAAGCTGGAC 
CAGAAACGTA ACAACGTTGT GGTTTCTCGT CGTGCCGTTA TCGAATCCGA AAACAGCGCA 
GAACGCGATC AGCTGCTGGA AAACCTGCAG GAAGGCATGG AAGTTAAAGG TATCGTTAAG 
AACCTCACTG ACTACGGTGC ATTCGTTGAT CTGGGCGGCG TTGACGGCCT GCTGCACATC 
ACTGATATGG CCTGGAAACG CGTTAAGCAT CCGAGCGAAA TCGTGAACGT TGGCGACGAA 
ATCAACGTGA AAGTGCTGAA ATTCGACCGC GAGCGTACCC GTGTATCCCT GGGTCTGAAA 
CAGCTGGGCG AAGATCCGTG GGTTGCTATC GCTAAACGTT ATCCGGAAGG TACCAAACTG 
ACCGGTCGCG TGACCAACCT GACCGACTAC GGCTGCTTCG TTGAAATCGA AGAAGGCGTT 
GAAGGCCTGG TTCACGTTTC CGAAATGGAC TGGACCAACA AAAACATCCA CCCGTCCAAA 
GTGGTTAACG TTGGCGACGT AGTGGAAGTG ATGGTTCTGG ATATCGACGA AGAACGTCGT 
CGTATCTCCT TAGGGTTGAA GCAGTGCAAA TCTAACCCGT GGCAGCAGTT CGCAGAAACC 
CACAACAAGG GCGACCGCGT TGAAGGTAAA ATCAAGTCTA TCACTGACTT CGGTATCTTC 
ATCGGCCTGG ACGGCGGCAT CGACGGCCTG GTTCACCTGT CTGACATCTC CTGGAACGTT 
GCAGGCGAAG AAGCAGTTCG TGAATACAAA AAAGGCGACG AAATCGCTGC AGTTGTTCTG 
CAGGTTGACG CAGAACGTGA ACGTATCTCC TTGGGCGTTA AACAGCTCGC AGAAGATCCG 
TTCAACAACT GGGTTGCTCT GAACAAGAAA GGCGCTATCG TAACCGGTAA AGTCACTGCA 
GTTGACGCGA AAGGCGCAAC CGTAGAACTG GCTGACGGCG TTGAAGGTTA CCTGCGTGCT 
TCTGAAGCAT CCCGTGACCG CGTTGAAGAT GCGACTCTGG TTCTGAGCGT TGGCGACGAC 
GTTGAAGCTA AATTCACCGG CGTTGATCGT AAAAACCGCG CAATCAGCCT GTCTGTTCGT 
GCGAAAGACG AAGCTGACGA GAAAGATGCC ATCGCAACTG TTAACAAACA GGAAGATGCA 
AACTTCTCTA ACAACGCAAT GGCTGAAGCA TTCAAAGCAG CTAAAGGCGA GTAA

Protein sequence

MTESFAQLFE ESLKEIETRP GSIVRGVVVA IDKDVVLVDA GLKSESAIPA EQFKNAQGEL 
EIQVGDEVDV ALDAVEDGFG ETLLSREKAK RHEAWITLEK AYEDAETVTG VINGKVKGGF 
TVELNGIRAF LPGSLVDVRP VRDTLHLEGK ELEFKVIKLD QKRNNVVVSR RAVIESENSA 
ERDQLLENLQ EGMEVKGIVK NLTDYGAFVD LGGVDGLLHI TDMAWKRVKH PSEIVNVGDE 
INVKVLKFDR ERTRVSLGLK QLGEDPWVAI AKRYPEGTKL TGRVTNLTDY GCFVEIEEGV 
EGLVHVSEMD WTNKNIHPSK VVNVGDVVEV MVLDIDEERR RISLGLKQCK SNPWQQFAET 
HNKGDRVEGK IKSITDFGIF IGLDGGIDGL VHLSDISWNV AGEEAVREYK KGDEIAAVVL 
QVDAERERIS LGVKQLAEDP FNNWVALNKK GAIVTGKVTA VDAKGATVEL ADGVEGYLRA 
SEASRDRVED ATLVLSVGDD VEAKFTGVDR KNRAISLSVR AKDEADEKDA IATVNKQEDA 
NFSNNAMAEA FKAAKGE