Gene Rcas_2135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_2135
Symbol
ID	5539615
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	-
Start bp	2745006
End bp	2746343
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	62%
IMG OID	640894269
Product	carboxyl-terminal protease
Protein accession	YP_001432238
Protein GI	156742109
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0697413
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCTTCC GTTTTCGGTT CCTTCGTCGT CTTGCCGCTG CAAGTCTGTT CCTGCTAGCG 
GGGTTCGCCG GCGGTTGGGT CAGCGCGACC ATTTTTGCCG ACAGCATCTC GCTCACGCGC 
CTGGTTCCGG CGATCGGTCC AGGATTGGTT GCCAATCAGG AAACGCCGCC ATCGCTCCGG 
CAGCAGTTCC GCGTCTTCTG GGAAGTGTGG AACCTGGTCG AGACCGAGTT CTATCAGCGC 
GACAAGATCA ACCACACCCG CATGATCCGC GGCGCCATCA CCGGCATGCT GGCATCGCTC 
GACGATCCGT ACACCGTCTA TCAGGAACCG GAGCTGGCAT CACAGACGAA TGAGCACATG 
CAGGGGCGAA TGGGAGGCAT CGGCACCTAT CTACGGATCA CCGACGGGCG CGCATTTCTC 
TACAAGCCAA TCAAAGGAGC GCCAGCCGAA GCCGCCGGTC TCAAACAGGA CGACGAGATC 
GTGGCGATTG ACGGCGAACC GGTCGCGCCG ATGATTGCCG GTCTCGACGT GAACGAAGCG 
GCTGTCAAGG TCGCATCGAA AATCCGCGGG CAGGCGGGTA CGCAGGTGCG CCTGACTATC 
CGGCGGCAAC CGGACGACCA GGTGTTCGAC ATCACTCTGA CGCGCGCCGA CATCGTGGTG 
CCCGGCGTCG AAGCCCAACT GGTCGATGGC GGAATTGCCT ATATTCGCAT TATCGAGTTC 
AAAGCCAATA CCGTCCCCGA ATTCGACCAG GCGCTGCGCG AGTTGCTTCC GCAAGCGCCA 
AACGGCATCG TCCTCGATAT GCGCAACAAC CCCGGCGGCT TCCTCGACCA GGCGCGTGCC 
GTGCTCGGGC GGCTCTACAA TGGGGTCGCG CTCTACGAGC AGAACAGCAA AGGGGAAATC 
ACCGAAATCC GCACCGTTGG CGGTGATATT CGCGCCTTCG ATGTCCCCAT CGTCGTGCTG 
GTCAATGGCA GTTCCGCCAG CGCCAGCGAG ATCGTCGCTG GCGCATTGCG TGACAGTCGT 
CCGAACGTGA CGCTGATCGG CGAGAAAACC TTCGGCAAGG GATCGGTGCA GAACATCTAC 
CACCTGAGCG ATGGCAGCAG TGCGCGAATC ACGTTCGCGC ACTGGCTCAC CCCGGCGCGC 
ACCGAAATCG ACAAGGTTGG CATTACGCCG CAGTACGTCA TTCCTTATGC CGAAGACCCT 
GCCACGCAAA CCCTGTGTGT CGGCGACCGC CAGCCGCCGC CGGGAGCGAC GACCTGCGCC 
GACAACCAGT TGTTCTACGC CATCCGGCTG CTGCGCACCG GCGAAGCGCC GCCATCGATG 
CCGGCGGCGG CACGGTGA

Protein sequence

MAFRFRFLRR LAAASLFLLA GFAGGWVSAT IFADSISLTR LVPAIGPGLV ANQETPPSLR 
QQFRVFWEVW NLVETEFYQR DKINHTRMIR GAITGMLASL DDPYTVYQEP ELASQTNEHM 
QGRMGGIGTY LRITDGRAFL YKPIKGAPAE AAGLKQDDEI VAIDGEPVAP MIAGLDVNEA 
AVKVASKIRG QAGTQVRLTI RRQPDDQVFD ITLTRADIVV PGVEAQLVDG GIAYIRIIEF 
KANTVPEFDQ ALRELLPQAP NGIVLDMRNN PGGFLDQARA VLGRLYNGVA LYEQNSKGEI 
TEIRTVGGDI RAFDVPIVVL VNGSSASASE IVAGALRDSR PNVTLIGEKT FGKGSVQNIY 
HLSDGSSARI TFAHWLTPAR TEIDKVGITP QYVIPYAEDP ATQTLCVGDR QPPPGATTCA 
DNQLFYAIRL LRTGEAPPSM PAAAR