Gene Francci3_1057 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1057
Symbol	rpsA
ID	3905303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1259062
End bp	1260540
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	65%
IMG OID	637878391
Product	30S ribosomal protein S1
Protein accession	YP_480168
Protein GI	86739768
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID	[TIGR00717] ribosomal protein S1

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.960366
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGACGAGCA CCACCGACGT ACGACCCGTG GAGACCGTGA CCATCTCGCC CAGCCCGACC 
ACACCACAGG TAGCGGTCAA CGACATCGGC TCGGCCGAAG ACTTCCTTGC GGCCGTCGAC 
AAGACGATCA AGTTCTTCAA CGATGGCGAC ATCGTTGACG GCATCATCGT CAAGGTCGAC 
CGCGACGAGG TGCTGCTCGA CATCGGCTAC AAGACCGAGG GCGTGATCCC GTCCCGGGAA 
CTGTCGATCA AGCACGACGT CGACCCGCAC GAGGTCGTCA GTGTGGGCGA CCACGTCGAG 
GCCCTTGTCC TCCAGAAGGA GGACAAGGAA GGCCGCCTGA TCCTGTCCAA GAAGCGTGCG 
CAGTACGAGC GCGCCTGGGG CACGATCGAG AAGCTCAAGG ACGAGGACGG TGTCGTCACC 
GGCACCGTGA TCGAGGTCGT CAAGGGTGGT CTCATCCTCG ACATCGGCCT GCGTGGCTTC 
CTGCCGGCTT CGCTTGTGGA GATGCGCCGG GTCCGCGATC TGCAGCCCTA CGTGGGCCGC 
GAGCTCGAAG CCAAGATTAT CGAGCTGGAC AAGAACCGCA ACAACGTTGT GCTCTCGCGG 
CGGGCCTGGC TCGAACAGAC CCAGAGCGAA GTCCGTTCCG AGTTCCTCGC CCAGCTGGCC 
AAGGGCCAGA TCCGCAAGGG CGTGGTCAGC TCCATCGTCA ACTTCGGCGC CTTCGTGGAC 
CTCGGTGGTG TGGACGGCCT CGTGCACGTC TCCGAGCTGT CCTGGAAGCA CATCGACCAC 
CCGTCCGAGG TGGTCGAGGT CGGCCAGGAG GTTACCGTCG AGGTCCTCGA TGTCGACTTG 
GACCGCGAGC GGGTCTCGCT GTCGCTGAAG GCGACGCAGG AGGACCCGTG GCGTCAGTTC 
GCCCGGACCC ACGCGATCGG TCAGGTCGTT CCAGGCCGGG TCACGAAGCT GGTGCCGTTC 
GGTGCGTTCG TCCGGGTGGA CGAGGGCATC GAGGGTCTGG TCCACATCTC CGAGCTGGCC 
GAGCGGCACG TGGAGATCCC CGAGCAGGTC GTGAACGTCG GTGACGAGAT CCTGGTGAAG 
GTCATCGACA TCGACCTCGA CCGCCGCCGC ATCAGCCTGT CGCTCAAGCA GGCGAACGAG 
GCGACAGGGC TGGCTGTCGA CGGCGAGGCG TTCGACCCGA GCCAGTACGG CATGGAAGCC 
AAGTACGACG AGCAGGGTAA CTACGTCTAC CCCGAAGGCT TCGACCCCGA GACCGGGGAA 
TGGCTCGAAG GTTACGAGGA GCAGCAGGCG GAATGGGAGC GGCAGTACGC CGAGGCCCAG 
GCCCGCTTCG AGGCGCACCA GGTCCAGATC CGGGCCGCGC AGGAGGCCGA TGCCGCCGCG 
GCGGCCCCCT CCTCCTACAC CTCCCAGTCC GAGCAGCCTT CCTCGGCGAT CGATGAAGAG 
GCGCTGCGTC GGCTGCGTGA GCAGTTCGGT CGGGAGTAG

Protein sequence

MTSTTDVRPV ETVTISPSPT TPQVAVNDIG SAEDFLAAVD KTIKFFNDGD IVDGIIVKVD 
RDEVLLDIGY KTEGVIPSRE LSIKHDVDPH EVVSVGDHVE ALVLQKEDKE GRLILSKKRA 
QYERAWGTIE KLKDEDGVVT GTVIEVVKGG LILDIGLRGF LPASLVEMRR VRDLQPYVGR 
ELEAKIIELD KNRNNVVLSR RAWLEQTQSE VRSEFLAQLA KGQIRKGVVS SIVNFGAFVD 
LGGVDGLVHV SELSWKHIDH PSEVVEVGQE VTVEVLDVDL DRERVSLSLK ATQEDPWRQF 
ARTHAIGQVV PGRVTKLVPF GAFVRVDEGI EGLVHISELA ERHVEIPEQV VNVGDEILVK 
VIDIDLDRRR ISLSLKQANE ATGLAVDGEA FDPSQYGMEA KYDEQGNYVY PEGFDPETGE 
WLEGYEEQQA EWERQYAEAQ ARFEAHQVQI RAAQEADAAA AAPSSYTSQS EQPSSAIDEE 
ALRRLREQFG RE