Gene Rxyl_3165 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_3165
Symbol
ID	4114963
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	-
Start bp	3176950
End bp	3178080
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	69%
IMG OID	638037931
Product	peptidase M50
Protein accession	YP_645883
Protein GI	108805946
COG category	[R] General function prediction only
COG ID	[COG1994] Zn-dependent proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGGCT CCTTCAAGAT AGGCCGGGCG TTCGGCATCG ACGTGAAGGT CCACTGGACC 
TTCCTGCTGC TCATCGTCTT CTTCGGCCTT CTGGCCTACC AGGCCACCGG GAGCGCCGGG 
CGGGCGCTGG CGGTCATCGG CCTGATCCTG GGCCTCTTCG TGTGCGTCCT GCTGCACGAG 
TACGGCCACT CCCTCACCGC CCAGCGCCTC GGCATAGAGA TAAACGACAT CACCCTCCTG 
CCCATCGGCG GCCTGGCCCG GATGAAGTCC CTCCCCGAGA GGCCCGCCGA CGAGGTGAAG 
ATCGCCATCG CGGGCCCCCT GGTGAACGTG GTGCTCGCCC CCGTCTTCTT CGGCGTCGGC 
TACCTGCTCG GCTCCTCCCC CTTCGGCGCC ACCGGCTTCG TCTCCGCCGC CGACTCGGCC 
GGGCAGTTCT TCTCCTTTCT CGGGGTGGTG AACGTTCTGC TGGCGGTCTT CAACCTGATC 
CCGGCCTTCC CCATGGACGG CGGCCGGGTG CTGCGGGGCC TGCTGGCCTC CCGGGTGGGG 
CCCGTGCGGG CGACGGACAT CTCCTCGGCC GTGGGACAGG GCTTCGCCCT GCTGTTCTTC 
ATCTACGGGC TGCTGGGGGG GAACCTGCTC TTGGTGCTCA TCGCCGTCTT CATCTTCTTC 
GGGGCCGGCG GGGAGGCCGA GCTCGTGCGC CAGCGCGAGC TGATGCGCGG CCTCACCGTC 
CGCGACGTCA TGGGCACCCG CAGGAGGACG GAGACGGTAA CCCCCTGGCA CACCTTCGGC 
CAGGTGCTCG ACTCCGTCAT CCACGGCTAC CAGACCGACT TCCCCGTGGT GGACGAGGAC 
GGCAGGCTGG TGGGGATGCT GACGCGCAAC GAGATCATGT CCGCCGCCCA CTCCCCGGAC 
CGCTTCAGCG AGGTGCGCCA GATCATGCGC ACCGAGTTCC CCACGATCTC CCCGGAGGCC 
GACCTGTTCG CCGAGGGGCA GAAGCTCCTG CAGGAGAGCG GCCTGCGCGC GATCCCGGTG 
GTCGAGGACG GGGAGCTGGT CGGGATGCTG ACGGTGGAGG ACATGAGCCA GGCGGCGCTG 
CTGCGCGACA TCCGCAAGCT GCAGCAGCGG CCCGCGCCCT GGGGGCGCTG A

Protein sequence

MGGSFKIGRA FGIDVKVHWT FLLLIVFFGL LAYQATGSAG RALAVIGLIL GLFVCVLLHE 
YGHSLTAQRL GIEINDITLL PIGGLARMKS LPERPADEVK IAIAGPLVNV VLAPVFFGVG 
YLLGSSPFGA TGFVSAADSA GQFFSFLGVV NVLLAVFNLI PAFPMDGGRV LRGLLASRVG 
PVRATDISSA VGQGFALLFF IYGLLGGNLL LVLIAVFIFF GAGGEAELVR QRELMRGLTV 
RDVMGTRRRT ETVTPWHTFG QVLDSVIHGY QTDFPVVDED GRLVGMLTRN EIMSAAHSPD 
RFSEVRQIMR TEFPTISPEA DLFAEGQKLL QESGLRAIPV VEDGELVGML TVEDMSQAAL 
LRDIRKLQQR PAPWGR