Gene Acid345_1795 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1795
Symbol
ID	4071985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	2175569
End bp	2177188
Gene Length	1620 bp
Protein Length	539 aa
Translation table	11
GC content	59%
IMG OID	637983803
Product	SSU ribosomal protein S1P
Protein accession	YP_590870
Protein GI	94968822
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0539] Ribosomal protein S1
TIGRFAM ID	[TIGR00717] ribosomal protein S1

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGATT CCGATAACTT CAGCGACATC CTCAAGCAAT ACGACCACGC GCGTAACAGC 
AAAGGCCAAA TCGAAGGCAC CGTCGTCTCG GTCAACGATG AATTTGTTTT CGTGGACATC 
GGTTACAAGA CCGAAGGCAC CCTGCCAGTC TCGGTTTTCA CCAAGCCCGT AAATCCCGGC 
GACAAGCTTC TGGTTTCCAT CGCCGGACGC GATCCGGAGG GCGGCTATTA TCTGCTCTCG 
CGCACCCGGG TGCAGATTCC CACCGACTGG TCCGCGCTTG AGAAGGCCTT CGCTGACGAA 
GCCACCATCA TGGGCACCGT AACCGGCGTT ATAAAAGGCG GCGTGACCGT TGACGTGGGC 
GTACGTGCAT TCATGCCCGC CTCGCGTACC GGCACCCGCG ATGCCGCCGA GATGGAAAAG 
CTCGTCGGCA GTGAAATTCG TTGCCGCATC ACCAAGATCG ATGTAGCCGA TGAAGACGTT 
GTTGTTGACC GTCGCGCCGT TCTTGAAGAA GAAACCCGCG CGCAGGAAGG CCGACGCTAC 
GAAGAGTTGC AGGAAGGCGC GACTGTTCAC GGCACCGTCC GAAGCCTCGC CGATTACGGC 
GCGTTCGTAG ACATTGGCGG CGTGGATGCC CTTCTGCACG TGGCTGAAAT CTCGTGGTCG 
CGCGTCAACA GCCCGGCTGA TGTCCTGACC GTTGGCCAGG AAGTCGAAGC CAAGGTCATA 
AAAGTCGACC CCGAAAAGCG GCGCATTTCA CTGAGCATGA AACAGCTTCA GCCGCATCCG 
TGGGACTCAG TGCCGTCGAA ATACAAAGTC GGCGACCGCG TGCGCGGAAC GGTCTCTCGC 
CTGATGGATT TCGGCGCATT CGTTGAGCTT GAGCCCGGTA TCGAGGGAAT GATTCACGTC 
TCCGAAATGT CATGGGCGAA AAAGGTCCGC AAGCCCAGCG ATCTCCTGAA AACTGGCGAC 
AGCGTCGAAG CTGTCATCCT CGGCATCAAT CCGGCAGAAA AGCGCATTGC TCTCGGACTG 
AAGCAGGCGC TCGGCGATCC CTGGAAAGAC GCGTCACAGA AGTTCGCCGC CGGAACCGTA 
ATTGAAGGCC CAGTCACCAG CGTTCAAAAG TTCGGCGCAT TCGTGCAGTT GACCGAAGGC 
GTGGAAGGCA TGGTGCACGT CAGTGAACTC AGCGACAAGC GCGTAGATCA TCCGCAAGAT 
GTCGTGAAGC TCGGCCAGCG CGTGCAGGCG ATGGTCCTAG CGATCGATCC CGAGAAGCGC 
CAGATCAAGC TGAGCATGAA GCAGCTCATC CCCACCGGCC TCGACGAATA CATCGCCGAG 
CACAAACTTG GCGACATCGT GAGCGGACGT GTGCTCGAGG TCAATGGCGA GCGCGGACGC 
GCGGAACTCG GCCAAGGCAT CCAGGCCGAA GCCAAGTTCA CGCAAAAGGC AGCTCAACCC 
GCAGCGGCGG CCACCGCGAA AGCCGATCTC TCTTCCCTTA CCTCCATGCT TCAAAACAAG 
TGGAAGAGCG GTGCGTCCGC GAGTTCGAAG TCTGAAGATC TCCGTGCCGG CCAAATCCGC 
AGCTTCAAAA TTACGCGCCT CGACGCCGAC GCAAAGAAGA TCGAAGTCGA ACTCGAGTAA

Protein sequence

MSDSDNFSDI LKQYDHARNS KGQIEGTVVS VNDEFVFVDI GYKTEGTLPV SVFTKPVNPG 
DKLLVSIAGR DPEGGYYLLS RTRVQIPTDW SALEKAFADE ATIMGTVTGV IKGGVTVDVG 
VRAFMPASRT GTRDAAEMEK LVGSEIRCRI TKIDVADEDV VVDRRAVLEE ETRAQEGRRY 
EELQEGATVH GTVRSLADYG AFVDIGGVDA LLHVAEISWS RVNSPADVLT VGQEVEAKVI 
KVDPEKRRIS LSMKQLQPHP WDSVPSKYKV GDRVRGTVSR LMDFGAFVEL EPGIEGMIHV 
SEMSWAKKVR KPSDLLKTGD SVEAVILGIN PAEKRIALGL KQALGDPWKD ASQKFAAGTV 
IEGPVTSVQK FGAFVQLTEG VEGMVHVSEL SDKRVDHPQD VVKLGQRVQA MVLAIDPEKR 
QIKLSMKQLI PTGLDEYIAE HKLGDIVSGR VLEVNGERGR AELGQGIQAE AKFTQKAAQP 
AAAATAKADL SSLTSMLQNK WKSGASASSK SEDLRAGQIR SFKITRLDAD AKKIEVELE