Gene Rxyl_2188 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_2188
Symbol
ID	4117422
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	+
Start bp	2204818
End bp	2206065
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	76%
IMG OID	638036979
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_644944
Protein GI	108805007
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.180724
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAGGAC GGCCGGCCGT CCGCCGCTCC GCGCTTCAGG CATGCGCGGG GCTTGCGGCC 
TGCCTGCTCG CGCTGCTCCT GCTGCCGGCG GCGGGCCGCG GCGAGCCGGA GGGGGAGGTC 
GACGCGCTCC CCGGCGGGGC GCGCTACGTC GCCGGCGAGC TCCTGGTCGT CTACAGGTCG 
GCGCCCGGGC TGGAGCGGGC GCTCGAGGCG ACCGGCGGCA GGGTAAAGGA GGAGCTCCCC 
GCCTCCGACG CCCGGCTCGT GGTCTTCCCG GCCGTCCGGG AGAAGCCCTC GGAGGCCCTC 
AGGGAGCGGC TGCTCAGGGA GAAGAAGAGG GCCCTGGAGC AGAGCCCGGC CGTGGAGGCG 
GTGAGCTTCA ACTACCTGCG CGAGCCCCTC GCGAACCCGA ACGACCGCTA CTTCGGCCGC 
CAGTGGGGGC TCCGCAAGAT CCGGGCCCCC CTCGCCTGGA GCAGGGCGCG GGGCGGCGGG 
GCGCGCGTCG CCGTGCTCGA CAGCGGCGTG GCCGCCGGCC ACCCCGACCT GCGCGGGAAG 
ATCGCCGGCC GCTACAACAC CGACACCCGC ACCAGCTCGG CGGGCGACCA GTACGGGCAC 
GGGACCCACG TGGCCGGGAT AGCCGCGGCC TCCACGAACA ACCGGATCGG GGTGGCGGGG 
ACCTGCCCGG GGTGCCGGCT GCTGGCGGTC AAGCTGGACG GGGACGGCCT GATCACGACG 
ACGGACCTGG TGCGCGGGAT CAACTGGGCA ATCGGCCGCC GCGCGGACGT AATAAACCTC 
TCCCTGGGGG GCGGCGGCTT CAGCCGCCCC GAGGCCGACG CGATCGCGAA GGCCTGGAAC 
CGGGGCGCGG TGGTCGTAGC GGCCGCGGGC AACGAGCGCT CCAGCAGGCG GACCTACCCT 
GCGGCCTACC CGCAGGTCAT CGCCGTCTCG GCCACCACCC GGAGCGACGC CCGGGCCCGG 
TACTCCAACT ACGGCGGCTG GGTGGACGTC GCGGCCCCGG GCGGCACCTC CGGCACCGGC 
GGGATCTACT CGACCCTCCC CGGCGGCCGC TACGGCTACC TGAGCGGCAC CAGCATGGCC 
GCGCCGTTCG TCTCCGGCGT CGCCGGGCTG CTCGCCGGGC AGGATCTCGC GAACAGCCAG 
ATCCGGCGCC GCATACAGTC CACCGCCGCG GACCTCGGCC CTCGCGGCCG CGACCCCTAC 
TACGGCCACG GCCGGTTGGA CGCCGCCGCC GCGGTGGGAG CCGCCTAG

Protein sequence

MRGRPAVRRS ALQACAGLAA CLLALLLLPA AGRGEPEGEV DALPGGARYV AGELLVVYRS 
APGLERALEA TGGRVKEELP ASDARLVVFP AVREKPSEAL RERLLREKKR ALEQSPAVEA 
VSFNYLREPL ANPNDRYFGR QWGLRKIRAP LAWSRARGGG ARVAVLDSGV AAGHPDLRGK 
IAGRYNTDTR TSSAGDQYGH GTHVAGIAAA STNNRIGVAG TCPGCRLLAV KLDGDGLITT 
TDLVRGINWA IGRRADVINL SLGGGGFSRP EADAIAKAWN RGAVVVAAAG NERSSRRTYP 
AAYPQVIAVS ATTRSDARAR YSNYGGWVDV AAPGGTSGTG GIYSTLPGGR YGYLSGTSMA 
APFVSGVAGL LAGQDLANSQ IRRRIQSTAA DLGPRGRDPY YGHGRLDAAA AVGAA