Gene Rxyl_3020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_3020
Symbol
ID	4115956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	+
Start bp	3027711
End bp	3028685
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	73%
IMG OID	638037790
Product	peptidase S1 and S6, chymotrypsin/Hap
Protein accession	YP_645742
Protein GI	108805805
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACATCT TCGAGAACCT CTCTGCGAGC TCGCGGGTAG AGCCCGGCGA GCTCGACCCC 
TACTCCCGCA CCGTCCAGGA GGTGGCCAGA AAGCTCGAGC CCGCCGTCAT AGCGCTCGGG 
GTCCCGGGCG GCCGGGGCGG GGGGAGCGGC GTGATCCTGG GCCTGGACGA GGGGGCGGCC 
ACCGCCGTGA CCAACAGCCA CGTCGTGCAG GGCCTCTGGC AGCGGGGCGG GACGGGCACG 
ATCGCGGTCA TCCAGTCCGG CGGCGGGACG GCGCGCGCCG AGGTGCTGGG CTTCGACCAG 
CTGAGCGACC TGGCCGTGAT CCGCTTCTCC CCCGAGGAGG AGCCCGCGGT TGCCGAGCTG 
GGCGAGGCGG GCAACCTGGT GGTGGGCCAG CTCGTGGTGG CCATCGGGAG CCCCTTCGGT 
TTCCAGAGCA CCGTAACCGC CGGGGTGGTG AGCGCGCTCG GACGCACCCT CATGGGCCAG 
GACAGGCGCC TCGTCGAGAA CGTCATCCAG ACCGACGCCG CGGTGAACCC GGGCAACTCC 
GGCGGCCCGC TGGCCGACGC GGACGGGCGG GTGGTGGGGA TCAACACGGC GGTCTTCGGG 
GGCGCGCAGG GGCTGGGCTT CGCCATCCCC GTCTCGTCCT CCTTCCGGCG GGTGGTCTTC 
TCGCTGGTCA CCGAGGGCCG GGTGCGCCGG GCCTACCTGG GGGTGATGGT CCAGAGCCAG 
CCCGGCAGGG AGCCCTCGGG CCCGGGAGGC GGCGCCCGGG TGGAGAGCGT CGCCCCCAAC 
AGCCCCGCCG AGCGGGCCGG CCTGAGGCCC GGGGACGTGA TCGTGGGCTT CAAGCAACAG 
CCCGTGCGCA GCACGGACGA TCTGCTCAGC CTGCTGGACG GCTCGGTGAT CGGACGCGAC 
GTCCAGATCC GGGTGCTGCG CCGCGGGAAG GAGACCCCGC TGAGCATCCG GCCCCAGGAG 
TACCCGGAGG AGTAG

Protein sequence

MDIFENLSAS SRVEPGELDP YSRTVQEVAR KLEPAVIALG VPGGRGGGSG VILGLDEGAA 
TAVTNSHVVQ GLWQRGGTGT IAVIQSGGGT ARAEVLGFDQ LSDLAVIRFS PEEEPAVAEL 
GEAGNLVVGQ LVVAIGSPFG FQSTVTAGVV SALGRTLMGQ DRRLVENVIQ TDAAVNPGNS 
GGPLADADGR VVGINTAVFG GAQGLGFAIP VSSSFRRVVF SLVTEGRVRR AYLGVMVQSQ 
PGREPSGPGG GARVESVAPN SPAERAGLRP GDVIVGFKQQ PVRSTDDLLS LLDGSVIGRD 
VQIRVLRRGK ETPLSIRPQE YPEE