Gene Rxyl_0263 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_0263
Symbol
ID	4117753
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	-
Start bp	269314
End bp	271203
Gene Length	1890 bp
Protein Length	629 aa
Translation table	11
GC content	67%
IMG OID	638035053
Product	CRISPR-associated Cmr2 family protein
Protein accession	YP_643052
Protein GI	108803115
COG category	[R] General function prediction only
COG ID	[COG1353] Predicted hydrolase of the HD superfamily (permuted catalytic motifs)
TIGRFAM ID	[TIGR02577] CRISPR-associated protein, Crm2 family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGC AATCACTCCA CTTCACCCTG GGTCCGGTGC AGGGCTTCGT CGGACAGGCG 
CGGCGCACCC GCGACCTGTG GGCGGGCTCC TTCCTGCTCT CCTACCTCGC CGGGCAGGCG 
ATGAAGGCGG TACTCGAAGG TGGAGGCGAA ATCGTCTTTC CCGAGATCGG CACCCGGGAG 
AGGCCCACCG ACCCGCTTCT CGCCGCGATC CTGAAGAGAC CCATCTCTGA AAACCCGCGC 
CCCGAGATCG GCTCGCTCCC CAACCGCTTC AAGGCCGGGG TGCAGGATGG CTTCGATCCG 
GAGCGCTGCG AGGAGGCGGT GAGGGAAGCC TGGAAGAGGA TCGCCAGCAG CGTCTGGGAG 
CGGTACGTCG AGCCGGTAGC GGCTTACGGC AAGGGCACGA AGGAGATCTG GGAGCGGCAG 
GTCGAGGGCT TCTGGGAGAT GAGCTGGGTC ATAGGCGAGG ATCCCGGAGA CCGCAGCGAC 
CAGCGCTGGC TCGATCTGCG CAAGAACTGG CGTACCCACC ATCCGCCCTC CGAGCCGGGG 
GACAAGTGCA CCCTGATGGG GAGCTGGCAG GAGCTCTCGG GGTACGTGAG AGCGAGGGAG 
CGCGAGGCGC AGGACAGGTT CTGGGATGAG CTCCGCAAGA AAGCCGGCAC GCTCAACCTG 
GGCGAGCACG AGCGGCTGTG CGCGATCGCC CTCATCAAGC GCCTCTTCCC GGAGGTCGCG 
AAAGAGACCA TCGGCTGGGA GCTCAACGCG AGAACCTGGC CCTCGACGCC GTACATGGCG 
GCCGTGCCCT GGATCGAGGA GGCGCGCAAT AAACCAGAGG CCAAGAAGCA TCTCGAGCTG 
GTACGCTCCA GCGGGGCGCG AAGCTCGGCC TTCGGCGAGT ACAACACCAA CCTCGCGTGC 
CCGAAGAATG AGAAGGACTT CGCCCGGCTC GACGGCAACT TCTTCCACAG AGCGGCCCTC 
GAGAACGAGC GGGCAACCCC GGACCTCTCT CCCCAGGAAC GAAAAGGCCT TCTCGAAAAC 
CTGAAGGCTC TCAATGAGGC CGTGGGGCAC CCGGCCTCGA CCTTCTACGC CCTCTTGCTC 
ATGGACGGCG ACAGGCTCGG CAGCCTGCTG CAGAACAAGG ACATCGAGCC CGAGCTCATC 
TCCCGGGCCC TCGCGGAGTT CACTGCGGAG GTCGAGGGGA TCATCGGAGA TCACTGCGGC 
AGGACGGTCT ACGCCGGAGG CGACGACGTG CTCGCGCTCC TGCCGGTCGA CCGGGCGCTA 
CAGGCCGCGG CGGAGTTGCG CTGCAGGTTC CGCCGCGCGT TCGGCTCCGT GTTCGGCGAC 
CGGAGGCCGG TAGACAAGGA TGGCAAAACC CTCAAGACGA CCATCTCCGC CGGGCTCGTC 
TACGCCACCT ACAACACGCC GCTGCGGGCG GTGATGCAGG AGGCGCACCG GCTGCTCGAC 
GAGGTCGCCA AGGACGAGAA CGGCCGCGAC AGCATCGCGG CGAGCGTTCT CGCCGGCAGC 
GGGCGCACCG TCCAGTGGGT CTCGGCCTGG GACGAGGGGC CGGGTGACGA GCAAATGATC 
ACGAGCACCC TGACGGGCCT CGCAGAAGAC CTGGAGGAGG AGTTCGCGGG CCGCTTCTTC 
TACAACGTCC GCGAGCGTTT CGATGTTCTC ACCGGCGACG GCGATAGGCT CATCGAGGAT 
CTCGACGCGC AGGCCCTCCT CGTCGCCGAG TACCTGAAGA GCCGGGAGCG CGACGGAGAC 
AGGAGGGAGG CCGAGAAAAC CATAGAGCGG CTCCTCAAAG TATGCCGCCG CCGGAAGGGA 
GGAGAGGCGC CCGACGAGGG CACGCTCGAC GTCTCGGGGG CGATGCTGGT CCGGTTTCTC 
GCGACGAAGG GACGGGGGGT GGAGAGATGA

Protein sequence

MKKQSLHFTL GPVQGFVGQA RRTRDLWAGS FLLSYLAGQA MKAVLEGGGE IVFPEIGTRE 
RPTDPLLAAI LKRPISENPR PEIGSLPNRF KAGVQDGFDP ERCEEAVREA WKRIASSVWE 
RYVEPVAAYG KGTKEIWERQ VEGFWEMSWV IGEDPGDRSD QRWLDLRKNW RTHHPPSEPG 
DKCTLMGSWQ ELSGYVRARE REAQDRFWDE LRKKAGTLNL GEHERLCAIA LIKRLFPEVA 
KETIGWELNA RTWPSTPYMA AVPWIEEARN KPEAKKHLEL VRSSGARSSA FGEYNTNLAC 
PKNEKDFARL DGNFFHRAAL ENERATPDLS PQERKGLLEN LKALNEAVGH PASTFYALLL 
MDGDRLGSLL QNKDIEPELI SRALAEFTAE VEGIIGDHCG RTVYAGGDDV LALLPVDRAL 
QAAAELRCRF RRAFGSVFGD RRPVDKDGKT LKTTISAGLV YATYNTPLRA VMQEAHRLLD 
EVAKDENGRD SIAASVLAGS GRTVQWVSAW DEGPGDEQMI TSTLTGLAED LEEEFAGRFF 
YNVRERFDVL TGDGDRLIED LDAQALLVAE YLKSRERDGD RREAEKTIER LLKVCRRRKG 
GEAPDEGTLD VSGAMLVRFL ATKGRGVER