Gene Nmul_A2069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A2069
Symbol	rpsA
ID	3784387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2359041
End bp	2360756
Gene Length	1716 bp
Protein Length	571 aa
Translation table	11
GC content	54%
IMG OID	637812158
Product	30S ribosomal protein S1
Protein accession	YP_412755
Protein GI	82703189
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID	[TIGR00717] ribosomal protein S1

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000607618
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTACTG TTTCCCCCGC TGTCGACTCT TCTGAAAGTT TCGCAGCGTT ATTTGAAGAA 
AGCCTTTCCC GTCAGGAAAT GCGTATCGGT GAAGTCATCA CCGCGCAGGT CGTCCGGGTC 
GATTACAACA TCGTAGTCGT AAACGCCGGG CTCAAATCAG AGAGTTTCAT CCCCGTCGAC 
GAGTTCAAGA ACGACAAGGG CGAAGTTGAA GCCAAGCCCG GCGATTTTGT CAGCGTCGCC 
ATCGAGGCGC TGGAAGATGG CTATGGCGAA ACCCGCCTGT CACGGGACAA AGCAAAGCGC 
CTTACCGCCT GGCATGACCT GGAGGCTGCA ATGGAAAGCG GCGCCATCGT ATCGGGTGTC 
GTGAGCGGCA AGGTCAAAGG TGGATTGACT GCCATGATCA ATGGTATTCG CGCCTTTCTG 
CCCGGCTCGC TGGTGGATAT CAGGCCGGTC AAGGATACGA CTCCTTACGA AAACAAGGAG 
ATGGAATTCA AGGTTATCAA ACTTGACCGG AAGCGAAACA ACGTGGTGGT ATCTCGCCGT 
GCAGTGCTGG AAGAAACCCA GGGGGCTGAC CGCCAGACGT TGCTCGCCAA TCTGACCGAA 
GGCGCGATCG TCAAGGGTAT TGTCAAGAAT ATTACCGATT ACGGCGCATT CGTGGATCTG 
GGGGGCATAG ACGGCTTGCT GCACATTACC GATCTTGCGT GGCGGCGGGT AAAGCACCCC 
TCCGAGGTCA TCAGTGTCGG TGATGAAGTA ACCGCGAAAG TCCTCAAATT CGATCAGGAA 
AAAAACCGCG TTTCACTGGG TATGAAGCAA TTGACGGAAG ATCCATGGGT AGGATTGTCG 
CGGCGGTATC CGCCCCATAC CCGCTTGTTC GGCAAGGTCA GCAACCTTAC CGATTACGGC 
GCGTTTGTTG AAATCGAGCA AGGCATTGAA GGCCTCGTGC ATGTCTCCGA AATGGATTGG 
ACCAACAAGA ACGTGTACCC GTCCAAAGTT GTGCAATTGG GCGATGAAGT AGAAGTGATG 
ATTCTTGAGA TCGATGAAGA GCGGCGTCGC ATTTCGCTCG GCATGAAGCA GTGCAAAGTG 
AATCCCTGGG AAGATTTCGC CATGAATCAT CAAAAAGGCG ACAAGGTGCG AGGTCAGATC 
AAATCCATTA CGGATTTCGG CGTCTTTATC GGGCTGCAAG GCGGGATAGA CGGACTGGTG 
CATCTTTCCG ATCTTTCCTG GAATCAGCCG GGGGAAGAAG CCGTGCGCAA TTACAAGAAG 
GGTGACGAGG TCGAGGCGGT CGTGCTGTCC ATCGATGTGG AGCGCGAGCG CATCTCGCTT 
GGCATCAAGC AATTGGAAGG CGATCCCTTC AACAGCTTTG TCTCGGTGCA TGACAAGAAC 
AGTATTGTCA AAGGGACGGT AAAGTCGATT GATGCGAAGG GCGCCGTGAT TTCACTCGAG 
AATGATGTCG AAGGCTACCT GCGCGCGTCA GAAGTGTCGC GCGACCGGGT TGAGGACATT 
CGTTCCCACT TGAAGGAAGG TGATGTGGTT GAGGCGATGA TCATTAACGT CGATCGCAAA 
AATCGCGGCA TTAACCTTTC GATCAAGGCG AAGGATATGG CGGAGGAATC CGACGCGATG 
CAGAAGGTGG CAGGCGACGC ATCCGCCAGC GCGGGAACCA CCAGTCTGGG TGCTTTGCTC 
AAGGCCAAGA TGGATGTTAA GAATACGGAA CAATAA

Protein sequence

MATVSPAVDS SESFAALFEE SLSRQEMRIG EVITAQVVRV DYNIVVVNAG LKSESFIPVD 
EFKNDKGEVE AKPGDFVSVA IEALEDGYGE TRLSRDKAKR LTAWHDLEAA MESGAIVSGV 
VSGKVKGGLT AMINGIRAFL PGSLVDIRPV KDTTPYENKE MEFKVIKLDR KRNNVVVSRR 
AVLEETQGAD RQTLLANLTE GAIVKGIVKN ITDYGAFVDL GGIDGLLHIT DLAWRRVKHP 
SEVISVGDEV TAKVLKFDQE KNRVSLGMKQ LTEDPWVGLS RRYPPHTRLF GKVSNLTDYG 
AFVEIEQGIE GLVHVSEMDW TNKNVYPSKV VQLGDEVEVM ILEIDEERRR ISLGMKQCKV 
NPWEDFAMNH QKGDKVRGQI KSITDFGVFI GLQGGIDGLV HLSDLSWNQP GEEAVRNYKK 
GDEVEAVVLS IDVERERISL GIKQLEGDPF NSFVSVHDKN SIVKGTVKSI DAKGAVISLE 
NDVEGYLRAS EVSRDRVEDI RSHLKEGDVV EAMIINVDRK NRGINLSIKA KDMAEESDAM 
QKVAGDASAS AGTTSLGALL KAKMDVKNTE Q