Gene Acid345_4661 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4661
Symbol
ID	4070706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	5518376
End bp	5520205
Gene Length	1830 bp
Protein Length	609 aa
Translation table	11
GC content	60%
IMG OID	637986701
Product	SSU ribosomal protein S1P
Protein accession	YP_593735
Protein GI	94971687
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID	[TIGR00717] ribosomal protein S1

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0143658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTTCG ACGATCCAAA CGTTACCTCG TCCACCGAAC AAAGCGAAGA ACACGGTGCT 
GCAGCGTCGC AGCAGCCGGT TGCTGTGCAG GCCCATAATC CACCCGAGGC AAAGCCCACT 
GCGGGCCGTC CTCGCAACGA AGAGAACATG ACGGAAGATT TCGCAACCGC ACTCGAATCC 
TTTGAACAAG AACAGTCTGA GCAGGCATTG AATGAGGACC GCGTCCTCGT TGGCCGAGTG 
CTCAGCATAA CCCCCCAGTA CGTCGTCGTA GACGTGGGCT TGAAGTCCGA GGGCGTAGTG 
CCCATCGAGG AAGTCAAGGA CCACGACGGC AACGTTTCCT TCCAGCCGGG CGAAGAAATC 
GCCGTGATGC AGGAAAAGGG ACACACCGAA GAGGGGTACG TGCACCTCTC CCACCAGAAG 
GCACAGCGCC TGAAGGCATG GGACGAGATC GAGAAAGCGT ACAACGATAA ATCTTCCATC 
AAGGCGCGGG CGATTGACCG CATCAAGGGT GGCCTCACCG TCGACATCAT GGGAGCGCGC 
GCGTTCCTGC CAGGTTCCCA GGTGGACCTG CGGCCGGTGC GCAATCTTGA CGCACTGAAG 
GGCCATGAGC TCGAAGTCCG GATCATCAAG CTGAACAAGA AGCGCGGCAA CATCGTAGTT 
TCGCGCAAGC AGATCCTGGA AGAAGAGCAG AACGACAAGA AGTCGAAGAC GCTCGAGCAC 
CTCAACGAAG ACGCGGTTCT CACCGGCACG GTGAAGAACC TGACCGACTA CGGTGCGTTC 
GTTGACCTCG GCGGCATCGA TGGCCTGCTG CACATCACCG ACATGTCGTG GGGACGCCTG 
ACTCATCCGC GCGACCTCGT TCAAGTCGGC GACCAGATCC AGGTAAAGGT GCTGAAGTTC 
GACCGAGATA AGCAGCGTGT CTCGCTGGGC TTCAAGCAGC TCACGCCTGA CCCGTGGCTC 
GACGCATCCG AACGGTACCC GATTGGCGCG CGCGTACACG GCCGCGTGAT CAGCGTGACC 
GACTACGGTG CGTTCATCGA ACTCGAACAG GGGATTGAAG GTCTCGTGCA CGTGAGCGAG 
ATGACCTGGT CGAAGCGGAT GAAGCATCCG TCGAAAATCG TCAACGTTGG CGATCAAGTC 
GACGCAGTGG TGCTGAACGT GAATCCGCAG GAACGTCGCA TCAGCCTCGG CCTGAAGCAG 
CTCGAAACTA ACCCGTGGGA GTCGCTGCAT GAGAAGTTCC CGGTGGGCGG CGTGGTTGAG 
GGCAAGGTCC GCAACCTGAC CGACTTCGGC GCGTTCATCG AGATTGAAGA CGGCATCGAC 
GGCCTCGTCC ACGTCAGCAA CCTGAGCTGG ACGAAGCGCG TGAAGCATCC TTCGGAAGTG 
CTGAAGAAGG GCGATAAGGT CAAGGCTGTG GTGCTCGCAA TCGAGCCCGA CAACCGCCGC 
CTCTCGCTCG GCGTGAAGCA GTTACAGCCC GATGTCTGGG AGACGTTCTT CGAAACGCAT 
CGCGTTGGCG ACATCATCCA CGGCAAGGTG CTGCGCCTCG CGAGCTTCGG TGCATTCATC 
GAGATCGCGG ACGGAGTGGA GGGCCTGTGC CACAACTCCG AAGCGAGCGA TGAGCACGGC 
GCTCCGCTCA AGCTGGAACC CGGACAAGAG TTCGACTTCA AGATCATCAA GATGAATCCT 
GATGAAAAGA AGGTCGGCCT CAGCCTCCGC GCAGTCGGCG AAGAAGCCAG CCGCGTAGAG 
ATCGAGAACT ACAAGGCTCC GGCCTCGAGT TCTCCGGGCG CTGCGACCAT CGGCGAACTG 
CTAAGCTGGA AGCGAGAGCA GCAAGACTAA

Protein sequence

MPFDDPNVTS STEQSEEHGA AASQQPVAVQ AHNPPEAKPT AGRPRNEENM TEDFATALES 
FEQEQSEQAL NEDRVLVGRV LSITPQYVVV DVGLKSEGVV PIEEVKDHDG NVSFQPGEEI 
AVMQEKGHTE EGYVHLSHQK AQRLKAWDEI EKAYNDKSSI KARAIDRIKG GLTVDIMGAR 
AFLPGSQVDL RPVRNLDALK GHELEVRIIK LNKKRGNIVV SRKQILEEEQ NDKKSKTLEH 
LNEDAVLTGT VKNLTDYGAF VDLGGIDGLL HITDMSWGRL THPRDLVQVG DQIQVKVLKF 
DRDKQRVSLG FKQLTPDPWL DASERYPIGA RVHGRVISVT DYGAFIELEQ GIEGLVHVSE 
MTWSKRMKHP SKIVNVGDQV DAVVLNVNPQ ERRISLGLKQ LETNPWESLH EKFPVGGVVE 
GKVRNLTDFG AFIEIEDGID GLVHVSNLSW TKRVKHPSEV LKKGDKVKAV VLAIEPDNRR 
LSLGVKQLQP DVWETFFETH RVGDIIHGKV LRLASFGAFI EIADGVEGLC HNSEASDEHG 
APLKLEPGQE FDFKIIKMNP DEKKVGLSLR AVGEEASRVE IENYKAPASS SPGAATIGEL 
LSWKREQQD