Gene Rxyl_2349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_2349
Symbol
ID	4115615
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	-
Start bp	2360787
End bp	2362100
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	70%
IMG OID	638037129
Product	sulfatase
Protein accession	YP_645089
Protein GI	108805152
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.00689032
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGGGGCG CCCCCGACGC GCCGCCCAAC ATCCTCTACC TCCACTCCCA CGACACCGGG 
CGCTGGGTGC AGCCCTACGG GCACGCCGTA CCCACCCCCA ACATTCAGAA GCTCGCCGAG 
GAGGGGGTGC TCTTCAGGCA GGCCTTCTGC GCCGCCCCCA CCTGCTCCGG GAGCCGGGCC 
TGCCTGCTCA CCGGGCAGTA CGCGCACTCC AACGGGATGG TCGGGCTCGC GCACCGGGGG 
TTCTCGCTCA AGGACTACCG GCACCACATC GTCCATACCC TGCGCCGCCT CGGTTACTGG 
TCGGCGCTCA TCGGGGAGCA GCACATCTCC AAAAAGCCTG AGGTGATCGG CTACGACGAG 
GTCTTCAAGA TCCCCACCAA CCACACCGAC GACGTGGTGC CCGTGACCCT CGAGCTCCTC 
TCCCGGGACC ACGGGCGGCC CTTCTTTCTC TCCGTGGGCT TCTTCGAGAC CCACCGGGAG 
TTCTTCCGTC CCAGCTCGCC CAGAAAGGCC AACTACGTCC TCCCGCCGCC CAACCTCCCG 
GACGCTCCGG AGACGCGGCT GGACATGGCC GCCTTCTGCG AGAGCGCCCG CTCGCTCGAC 
CGGGGGGTGG GGGCGGTGCT GGACGCCCTC GACGCTGCCG GGCTCGCCGA GAACACGCTG 
GTGATCTGCA CCACGGACCA CGGGATCGCC TTCCCGGGCT GCAAGGCCAC CCTCTACGAC 
CGGGGGCTGG GGGTCATGCT GATCCTGCGC GGCCCCGGCG GCTTCTCCGG CGGCCGGGCG 
TCGGACGCGC TGGTCTCCCA CATAGACATC TTCCCGACGG TCTGCGACCT CGTCGGGATA 
GAACGCCCCC CGTGGCTGCA GGGCGAGTCG CTGCTGCCGC TGGTGCGGGG GGAGGTGGAG 
GAGGTCCGGG AGGCCATCTT CGCCGAGAAG ACCTACCACG TTGCTTACGA GCCCCAGCGC 
TGCGTCCGGA CCCGGCGCTG GAAGTACATC CGGCGCTTTG ACGACCGCTC GACCCCGGTG 
CTGGCGAACA CCGACGACGG CCCGAGCAAG GAGCTTTTGC TGCGCCACGG CTGGGCGGAG 
CGCCCAGTCC CCGAGGAGCA GCTCTACGAC CTCCTCTACG ACCCGAACGA GGCGTGCAAC 
CTGGCCGGCG ACCCCGCCCA CGCCCCCGTG CTGCGGGAGA TGCGGGCGAG GCTCGAGCGT 
TGGATGCGCT CCACGCAGGA CCCCATCCTG CGGGGACCCG TACCGCCCCC GCCCGGCGCG 
GAGCTCAACC TCCAGGACCA GCTCTCCCCC AAGGACCCCA CCGTGCGGGT CTGA

Protein sequence

MRGAPDAPPN ILYLHSHDTG RWVQPYGHAV PTPNIQKLAE EGVLFRQAFC AAPTCSGSRA 
CLLTGQYAHS NGMVGLAHRG FSLKDYRHHI VHTLRRLGYW SALIGEQHIS KKPEVIGYDE 
VFKIPTNHTD DVVPVTLELL SRDHGRPFFL SVGFFETHRE FFRPSSPRKA NYVLPPPNLP 
DAPETRLDMA AFCESARSLD RGVGAVLDAL DAAGLAENTL VICTTDHGIA FPGCKATLYD 
RGLGVMLILR GPGGFSGGRA SDALVSHIDI FPTVCDLVGI ERPPWLQGES LLPLVRGEVE 
EVREAIFAEK TYHVAYEPQR CVRTRRWKYI RRFDDRSTPV LANTDDGPSK ELLLRHGWAE 
RPVPEEQLYD LLYDPNEACN LAGDPAHAPV LREMRARLER WMRSTQDPIL RGPVPPPPGA 
ELNLQDQLSP KDPTVRV