Gene Rxyl_3001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_3001
Symbol
ID	4115800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	-
Start bp	3008682
End bp	3009713
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	70%
IMG OID	638037771
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_645723
Protein GI	108805786
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTGCTGGA GAAGGATCCT GGTTTTGCTG GTGGCGGCCG TCGCCGCGCT CGCCCTCGCC 
GCGTGCGCCG AGGTCAGGGA GCAGGGAGGG GGCCAGCAGG GCGGCGGAGA GGGCCGGCAG 
GGCCCCATAG AGCTCGCCGT CGTGCCCAAG GCCGTGGGCT TCGACTTCTG GGAGACGGTG 
CGTCAGGGGG CGGTGTGCGC CGCCAAGAGG GCCGAGGGCG AGGTCGACGT CCAGTGGGAC 
GGGGTCGCCC AGGAGACCGA CGTTACCGGG CAGGTCAACC TGCTGCAGAA CTTCATCACC 
CAGGGGGTGG ACGGGCTCGT CTACGCCGCC ACCGACGCCA AGGTGCTCCA CGACGTCACG 
CAGCAGGCGC TCGACCAGGG CATAACCGTG GTCAACATAG ACTCCGGCAC CGACCCGCAG 
CCCGAGAACG TGCCGGTCTT CGCCACGGAC AACGTGGCGG CCGCCGAGCG GGCGACCGAG 
TACCTGGTGG AGCAGCTCGG CGAGGACGGC GGGAAGGTGG CGTTCATCCC CTTCCAGCCC 
GGCACGGCGA CGAACGACAC CCGCACGGAG GGCTTCAAGA ACGTCCTCAA GGAGAACCCG 
CAGGTAAAGC TCGTCGCCGA GCAGTCCAGC GAGAGCAACT ACAACCGGGC GCTGCAGGTC 
ACCGAGGACA TCCTCACCGC CCACCCGGAT CTGGACGCCA TCTACGCGGC CAACGAGCCC 
GGCGTGCTGG GCGCCGCCGA GGCGGTGAGG AGCGCCGGGA AGGCCGGGGA GATCATCATC 
GTCGGCTGGG ACACCGCCCC CGACGAGCTC AAGGCCGTGC GCGAGGGCGT GGTGAGCGCG 
CTCATCGCCC AGAACCCCTT CAGGATGGGC TACGACGGGG TGAACGCGGC GGTGAAGATG 
ATCCGTACCG GCGAGCAGGT CGAGGGCGGC GACACGGGGG CGATACTGGT CACCCGGGAG 
AACATAGACG ACCCGGAGGT CCAGCGGGTC CTCGACCCGA GCTGCGAGAA CCCGCCCGTC 
GAAGGGCAGT AG

Protein sequence

MCWRRILVLL VAAVAALALA ACAEVREQGG GQQGGGEGRQ GPIELAVVPK AVGFDFWETV 
RQGAVCAAKR AEGEVDVQWD GVAQETDVTG QVNLLQNFIT QGVDGLVYAA TDAKVLHDVT 
QQALDQGITV VNIDSGTDPQ PENVPVFATD NVAAAERATE YLVEQLGEDG GKVAFIPFQP 
GTATNDTRTE GFKNVLKENP QVKLVAEQSS ESNYNRALQV TEDILTAHPD LDAIYAANEP 
GVLGAAEAVR SAGKAGEIII VGWDTAPDEL KAVREGVVSA LIAQNPFRMG YDGVNAAVKM 
IRTGEQVEGG DTGAILVTRE NIDDPEVQRV LDPSCENPPV EGQ