Gene Rxyl_0738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_0738
Symbol
ID	4116564
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	+
Start bp	768120
End bp	769181
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	72%
IMG OID	638035522
Product	peptidase M42
Protein accession	YP_643519
Protein GI	108803582
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.511886
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCAAAG AGTCCTACGA TTTCCTGAAG AGGCTCCTCT CCGCGCCGGG ACCGAGCGGC 
CGCGAGGAGG CCGCCGCGCG GGTGTGGCGG GAGGAGGCCG GGCGTTTCGC CGACGGGGTG 
CGCGGCGACA GGATGGGCAA CTCCTTCGCC ACGCTCAACC CCGGCGGCCG CCCGCGGGTG 
ATGCTCAGCG GGCACATAGA CGAGATCGGG CTGATCGTCA CCCACGTGGA CGAGCAGGGG 
TTCGTCCGCT TCAAGGGCGT CGGGGGCTGG GACCCGCAGG TGCTGGTGGG CCAGCGGGTG 
CGCCTCCGGA CCGGGAGCGG CGAGATCCCC GGCGTCATCG GCAAGAAGGC CATCCACCTC 
ATGGAGAGCG AGGAGCGCAA AAAGGCCTCC GAGATAAAGG GCCTGTGGAT AGACATCGGG 
GCGAGGGACG CCGAGGAGGC GCGCCGGAGC GTGCGCGTGG GGGATGTGGC TGTCCTCGAC 
CAGGAGCCGG TGGAGCTTCC CAACGGGCGC CTCGCCTCCC GCTCGCTGGA CAACCGGATG 
GGGGCCTTCG TCGTGCTGGA GGCGCTGCGG CTGCTCTCCG AGGAGGAGGG GCTCTCCGCC 
GAGGTGGTGG CGGTCGCCAC CGTGCAGGAG GAGGTCGGCA TCTACGGCGC CCGTGGCGCC 
GCCTTCGGGC TGGACCCGGA CGCGGCCATC GCCGTCGACG TCACCCACGC CACCGACACC 
CCCGGGGTGC CCAAGAACGA GCACGGGGAC CACCCGCTCG GCAGCGGCCC CGTCATAGCC 
CGGGCCTCCG TGCTCAGCCC GCTGGTTACG GACGGCCTCG TCTCCGCCGC CGAGCGCGAG 
GGCATCCCCT ACACCCTGGA GGCCGACTCC TCCCGCACCG GCACGGACGC CGACGCCATC 
CACCTCTCGC GGGCGGGGAT CGCCACCGGG CTCGTCTCCT GCCCCAACCG CTACATGCAC 
TCGCCGAACG AGATGGTGGA GCTGGGAGAT CTGGAGGGGT GCGCCCGGCT CATCGCCTCC 
TACGTGCGCT CGCTGGGCCC CGACGCGGAC TTCGTCCGGT AG

Protein sequence

MRKESYDFLK RLLSAPGPSG REEAAARVWR EEAGRFADGV RGDRMGNSFA TLNPGGRPRV 
MLSGHIDEIG LIVTHVDEQG FVRFKGVGGW DPQVLVGQRV RLRTGSGEIP GVIGKKAIHL 
MESEERKKAS EIKGLWIDIG ARDAEEARRS VRVGDVAVLD QEPVELPNGR LASRSLDNRM 
GAFVVLEALR LLSEEEGLSA EVVAVATVQE EVGIYGARGA AFGLDPDAAI AVDVTHATDT 
PGVPKNEHGD HPLGSGPVIA RASVLSPLVT DGLVSAAERE GIPYTLEADS SRTGTDADAI 
HLSRAGIATG LVSCPNRYMH SPNEMVELGD LEGCARLIAS YVRSLGPDAD FVR