Gene Rxyl_2973 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_2973
Symbol
ID	4115695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	-
Start bp	2977814
End bp	2979064
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	68%
IMG OID	638037743
Product	glycosyl transferase, group 1
Protein accession	YP_645695
Protein GI	108805758
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTGCAGC GGGTCAACCC GGGCCACAAG GCGCTGGCCG ACTACCGCAG CATCATCCGC 
CGCGAGCTCT ACGGGGAGCT GCAGGAGCTC GCCGGGCGCC TGCGGGGGGC GCGGGTGTTG 
CACATAAACG CCACCAGCTT CGGGGGCGGG GTGGCGGAGA TCCTCTACAC CCTCGTGCCT 
CTGGCCCGCG ACGCCGGGCT CGAGGTGGAG TGGGCCATAA TGTTCGGCGC CGAGCCCTTC 
TTCAACGTCA CCAAGAGGTT CCACAACGCC CTGCAGGGCG CCGACTACGA GCTGACAATA 
GAGGACCGGG CCATCTACGA GGAGTACAAC CGCAGGACCG CGCAGGCGCT CGCCGAGTCC 
GGCGAGGAGT GGGACATAGT CTTCGTCCAC GACCCGCAGC CCGCGCTCGT GCGGGAGTTC 
TCCGGGGGGT TGGGGGAGGG GACGCGTTGG ATCTGGCGCT GCCACATCGA CACCTCCACC 
CCCAACCGGC AGGTTCTCGA CTACCTGTGG CCGTACATAG CCGACTACGA CGCCCAGGTC 
TACACCATGC GCGAGTACAC CCCGCCCGGC GTCGAGATGC CCGGGCTCAC CCTCATCCCC 
CCGGCCATAG ACCCGCTCTC GCCCAAGAAC ATGGCCCTCT CGCGGGACGA CGCCAGCTAC 
ATCGTCAGCC AGTTCGGGGT CGACGTCGAG CGTCCCTTTC TGCTGCAGGT CTCCCGCTTC 
GACCCCTGGA AGGACCCCCT CGGCGTCATC GACGTCTACC GCATGGTCAA GGAGGAGGTG 
GGGGAGGTCC AGCTGGTGCT CGTCGGCTCC ATGGCCCACG ACGACCCCGA GGGGTGGGAC 
TACTGGTACA AGACCGTCAA CTACGCGGGC GGGGACCCGG ACATCTTCCT CTTCTCCAAC 
CTCACCAACG TCGGCGCCAT CGAGGTCAAC GCCTTCCAGT CGCTCGCCGA CGTCGTGATC 
CAGAAGTCCA TCCGGGAGGG CTTCGGGCTC GTGGTCTCCG AGGCGCTCTG GAAGGCCCGC 
CCGGTGGTGG CCAGCCGCGT CGGGGGCATC CCCATGCAGA TAACCGCCGG CGGCGGCATC 
CTGATAGACA CCATCCCGGA GGCGGCCGCG GCCTGCGCCA AGCTCCTCTC CGACCCGGAG 
TTCGCCCGCG AGATGGGGCG GCGCGGCAAG GAGCACGTCC GGGCCAACTT CCTCACCCCC 
CGCCTGCTGC GCGACGACCT GCGGCTTTTC GCTAAACTTC TCGGCGTGTA G

Protein sequence

MLQRVNPGHK ALADYRSIIR RELYGELQEL AGRLRGARVL HINATSFGGG VAEILYTLVP 
LARDAGLEVE WAIMFGAEPF FNVTKRFHNA LQGADYELTI EDRAIYEEYN RRTAQALAES 
GEEWDIVFVH DPQPALVREF SGGLGEGTRW IWRCHIDTST PNRQVLDYLW PYIADYDAQV 
YTMREYTPPG VEMPGLTLIP PAIDPLSPKN MALSRDDASY IVSQFGVDVE RPFLLQVSRF 
DPWKDPLGVI DVYRMVKEEV GEVQLVLVGS MAHDDPEGWD YWYKTVNYAG GDPDIFLFSN 
LTNVGAIEVN AFQSLADVVI QKSIREGFGL VVSEALWKAR PVVASRVGGI PMQITAGGGI 
LIDTIPEAAA ACAKLLSDPE FAREMGRRGK EHVRANFLTP RLLRDDLRLF AKLLGV