Gene Rcas_2107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2107
Symbol
ID	5539587
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2706219
End bp	2708639
Gene Length	2421 bp
Protein Length	806 aa
Translation table	11
GC content	59%
IMG OID	640894241
Product	peptidase S16 lon domain-containing protein
Protein accession	YP_001432210
Protein GI	156742081
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1067] Predicted ATP-dependent protease
TIGRFAM ID	[TIGR00764] lon-related putative ATP-dependent protease

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.801534
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGCAG AACTTCCTCC CGAACAGTTG CGCCGCACCT TCGATCCTGG GCAGATGGTC 
TTTCCTACCA CCGAAGAGCC GCCAGGAGAC GGCGGCATCA TTGGTCAGCA GCGCGCGGTC 
GCCGCACTGC GCTTCGGTCT CAATATGGTG GACGGCGGCT TCAACATCTA TGCCGCCGGC 
CCGCCCGGCA TCGGCAAGAT GACCGCTGTT CAGGCGTTTA TCGAAGAACT TGCACAGCGT 
CGTCCAACGC CGTCAGACTG GTGTTATGTC AATGATTTCG ATGATCCGTA TCAACCGAAG 
GCGCTGCGCC TTCCTCCTGG ACGCGGACGA CGCTTGCAGC AGGATGTCCA TCAGATGATT 
GCGCATCTGC GCGCCGAGCT GCCGCGCGCA TTCGAGAGTG ATGAGTATGC AATGCGGCGC 
GACGAGGTAT TGCACGAACT CAATTCCCAT CGTGAAGCCT TGCTCAGCCA GATCAGCGAA 
CGCGCCGCGC AACAGGGATT CGTGCTACAG GCCGGTCCTG TCGGCATCAT GATCATCCCA 
ATTCGCAACG GTGAACCGCT CAGTGACGCG GCATTCCAGG CAATGACCCT CGACCAGCGC 
GAGGAGTTGC TGCGCCATCG CGCAATGTTG CAGGAAGAAC TCAAGAACGT GTTGAAACAG 
GTGCGCGCAG CGGAACGGAT TGCGCGTCAG CGCATGGAAG AAATCGACCG CCAGGTCGTC 
GAGTACATCG TCGGCGGACT GATCGACGAT CTTCAGGAAC AGTACGCCGA CCTGCCCGAT 
GTCGTCGCCT TTCTCGAAGC GATGCAGAAA GATATCCAGG AAAATCCTGA CCCCTTTCGC 
TCAGGCGGAC AGCAGCAACC TTCCGGTGAA GCGCAGGTCG ATCTGGCGTC GATCCCGTGG 
CTCAGAGAAT TGCCGTTCCG TAAGTACCAG GTGAATGTCC TGATCGACAA CAGCCGTCAG 
CAGGGTGCGC CGGTGGTGGT TGAGTACAAT CCGACTTATC CCAATCTGTT TGGGCGTATC 
GAGAAGGAAA CGCACTTCGG CGCACTCTAT ACCGACTTCC TGATGATCAA GCCCGGCAGC 
CTGCACCGCG CCAATGGCGG GTTCCTCGTC ATTGAAGCCG AAGACCTGCT CCGCGATTAT 
TTCAGTTGGG ACGGGCTTAA ACGCGCTCTA CGCACGCGCG ACATTCAGAT CGAAGAACTG 
GCTGACCGCC TGGGGCTGAC AACCGTCAAG AGTCTCCGTC CGCAACCAAT CCCGCTTGAA 
CTCAAGGTTG TGCTCGTCGG ACCGCCGCCG CCATACTATC TCCTTGCCGC TTACGACGAT 
GAGTTTTCGA CCCTTTTCAA GGTTAAAGCC GATTTCGACA TCAGTATGCC GCTGAATGAC 
GAGAACCTGC GCGGGTCGTT GCATCTGTTT CGACGCTTCT GCGAGCGCGA AAAACTCCTG 
CCGATCACCG AGGAAGCAGC GGCGCGCCTG CTGGAACACT CGCTCCGCCT CGCCGATGAC 
CAGGAGCGCC TTTCGACGCA CTTCGGCGCG CTGACCGATG TGGTGCGCGA GGCGAACTAT 
TGGGCAATCC AGGAGCAGTG CAATGCTATT CTGGGGCGGC ATGTGCTTCG CGCGCTCGAT 
GAAAAGGTCT ATCGCTCGAA CATGATCCAG GCGCGCATCC AGGAATTGAT CGACCGCGGG 
ATTATCCTGA TCGATACAGA AGGCGCAAAG ATCGGTCAGA TCAATGGGTT GTCGGTGCTG 
AGCCTGGGGG ATTATATGTT TGGCAGACCA AGCCGTATCA GCGTCAGCGT CGGACCAGGG 
CGCGGCGCCA TTCTCGACAT CGAACGCGAG GTAAAACTGG GAGGACCAAT CCACAGCAAG 
GGAGTGCTCA TTCTCAGCGG ACACCTTGCG GAACGGTACG GGCAGGAACG TCCGCTGACC 
CTCTCAGCGC GGTTGGTCTT CGAGCAGAGT TATGAAGGGG TTGAGGGGGA CAGTGCTTCG 
GCAGCAGAGT TGTTCGCGCT GCTCTCGGCG CTTGCTGAAC TGCCGTTGCG CCAGAGTATC 
GCCGTTACCG GGTCGGTCAA TCAGCGTGGT GAGATCCAGG CGGTCGGTGG GGTCAACCAG 
AAAATCGAAG GGTTTTTCGA TATCTGCCGG TTACGCGGTC TAACGGGTGA ACAGGGGGTG 
CTCATTCCTC GAGCGAATGT GCAGAATCTG ATGCTGCGCA GCGACGTGGT GGAAGCAGTG 
CGTGAGGGAC GGTTCCACAT CTGGACAGCA GCCACCGTCG ATGAAGGCAT TGCCCTGCTG 
ACCGGCGTGC CGGCCGGCGA ACGCGGCGCA GATGGCGAAT ACCCGCCGGA CAGCGTCAAT 
GGCCGGGTGA TGACGCGGCT GCGCGCCTTT GCGGAACGTC TGCGCGAAGG AGGGAAGGGT 
AATGAGAAGG AAGCGCAGTG A

Protein sequence

MAAELPPEQL RRTFDPGQMV FPTTEEPPGD GGIIGQQRAV AALRFGLNMV DGGFNIYAAG 
PPGIGKMTAV QAFIEELAQR RPTPSDWCYV NDFDDPYQPK ALRLPPGRGR RLQQDVHQMI 
AHLRAELPRA FESDEYAMRR DEVLHELNSH REALLSQISE RAAQQGFVLQ AGPVGIMIIP 
IRNGEPLSDA AFQAMTLDQR EELLRHRAML QEELKNVLKQ VRAAERIARQ RMEEIDRQVV 
EYIVGGLIDD LQEQYADLPD VVAFLEAMQK DIQENPDPFR SGGQQQPSGE AQVDLASIPW 
LRELPFRKYQ VNVLIDNSRQ QGAPVVVEYN PTYPNLFGRI EKETHFGALY TDFLMIKPGS 
LHRANGGFLV IEAEDLLRDY FSWDGLKRAL RTRDIQIEEL ADRLGLTTVK SLRPQPIPLE 
LKVVLVGPPP PYYLLAAYDD EFSTLFKVKA DFDISMPLND ENLRGSLHLF RRFCEREKLL 
PITEEAAARL LEHSLRLADD QERLSTHFGA LTDVVREANY WAIQEQCNAI LGRHVLRALD 
EKVYRSNMIQ ARIQELIDRG IILIDTEGAK IGQINGLSVL SLGDYMFGRP SRISVSVGPG 
RGAILDIERE VKLGGPIHSK GVLILSGHLA ERYGQERPLT LSARLVFEQS YEGVEGDSAS 
AAELFALLSA LAELPLRQSI AVTGSVNQRG EIQAVGGVNQ KIEGFFDICR LRGLTGEQGV 
LIPRANVQNL MLRSDVVEAV REGRFHIWTA ATVDEGIALL TGVPAGERGA DGEYPPDSVN 
GRVMTRLRAF AERLREGGKG NEKEAQ