Gene RoseRS_3039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_3039
Symbol
ID	5210007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	+
Start bp	3819523
End bp	3820860
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	63%
IMG OID	640596631
Product	carboxyl-terminal protease
Protein accession	YP_001277353
Protein GI	148657148
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.619443
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGCCT ATCGTCCTGT GCTTCGTCGT CTTGCCGCCG CGCTGGTTCT GCTGACCGTC 
GGGTTCATCG GTGGTTGGGT AAGCGCCACG ATCTTCGCCG ACAGCATCTC GCTCACCCGG 
ATTGTTCCGG TGATTGGTCC TGGACTGGTC GCCAACCAGG AGACGCCGCC ATCGCTGCGG 
CAGCAGTTTC GCGTCTTCTG GGAGGTGTGG AATCTGGTTG AAGCCGAGTT CTACCGGCGC 
GACAAGATCA ACCACACGCG CATGATCCGC GGCGCTATCA GCGGCATGCT GGGGTCGCTC 
GACGATCCGT ACACCGTCTA CCAGGAACCG GAGCTGGCGT CGCAGACAAA CGAGCACATG 
CAGGGGCGCA TGGGGGGCAT TGGAACCTAC CTGCGGATCA CCGACGGGCG CGCCTACCTC 
TACAAGCCGA TCAAAGGCGC GCCTGCCGAC GCCGCCGGTC TCCGGCAAGA CGATGAGATC 
GTCGCAATTG ATGGCGAGCC GGTAGCGCCA ATGATCGCCG GTCTCGACAT TCACGAAGCG 
GCGGTCAAAG TGGCGGCGAA AATCCGCGGG CAGGCTGGCA CGCAGGTGCG TCTGACCATC 
CGGCGGCAAC CGGGCGATCA GGAGTTCGAT ATAACCCTGA CCCGCGCCGA CATTGTGGTT 
CCCGGCGTCG AAGCGCAACT TGTCGATGGC GGCGTCGCCT ATATCCGCAT CATCGAATTC 
AAAGCCAACA CCGTTCCCGA ATTCGATCAG GCGCTGCGCG AACTGCTGCC GCAGGCGCCG 
AAGGGAATCG TCCTTGACCT GCGCAACAAT CCCGGCGGCT ACCTGGATCA GGCACGCGCC 
GTATTAGGGC GACTGTACGA CGGGGTGGCG CTCTACGAGC AGAACAGCAA AGGAGAGTTG 
ACCGAAATCC GCACCGTCAG CGGCGACATT CGCGCGTATG ACCTTCCTAT CGTGGTGCTG 
ATCAACGGCG GTTCCGCCAG CGCCAGCGAA ATTGTCGCCG GGGCGTTGCG CGACAGTCGC 
CCGAATGTGA CGCTGATCGG CGAAAAAACC TTTGGCAAAG GGTCGGTGCA GAACATCTAC 
AACCTGAGCG ACGGGAGCAG CGCGCGCATC ACCTTTGCCC ACTGGTTGAC ACCGGCGCGC 
ACTGAAATCG ACAAGATCGG CATCATGCCG CAGTACGTCA TTCCCTACGC CGAAGATCCG 
GCCACGCAGG CGCCGTGCAT TGGCGACCGG CAACCGCCGC CTGGAGCGAC CACCTGCGCC 
GACAATCAAC TGTTCTATGC CATCCGCCTG CTGACAACCG GCGAAAAGCC GCCATCGATG 
CCAGCAGCGG CGCGCTGA

Protein sequence

MSAYRPVLRR LAAALVLLTV GFIGGWVSAT IFADSISLTR IVPVIGPGLV ANQETPPSLR 
QQFRVFWEVW NLVEAEFYRR DKINHTRMIR GAISGMLGSL DDPYTVYQEP ELASQTNEHM 
QGRMGGIGTY LRITDGRAYL YKPIKGAPAD AAGLRQDDEI VAIDGEPVAP MIAGLDIHEA 
AVKVAAKIRG QAGTQVRLTI RRQPGDQEFD ITLTRADIVV PGVEAQLVDG GVAYIRIIEF 
KANTVPEFDQ ALRELLPQAP KGIVLDLRNN PGGYLDQARA VLGRLYDGVA LYEQNSKGEL 
TEIRTVSGDI RAYDLPIVVL INGGSASASE IVAGALRDSR PNVTLIGEKT FGKGSVQNIY 
NLSDGSSARI TFAHWLTPAR TEIDKIGIMP QYVIPYAEDP ATQAPCIGDR QPPPGATTCA 
DNQLFYAIRL LTTGEKPPSM PAAAR