Gene Rxyl_1950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_1950
Symbol
ID	4115742
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	+
Start bp	1971745
End bp	1972917
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	76%
IMG OID	638036736
Product	hypothetical protein
Protein accession	YP_644709
Protein GI	108804772
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0965898
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGATTC TCGACGAGAG CGGCGCGCGC GCCCTCACGA CCTCCGTGGC GCGCTCCGGG 
CGGGAGCTTG AGGCGCTGGA GGCGGAATGG GAGGCGCTCT ACGCCGCAAG CCCCGCGGCC 
ACCCCCTTCC AGTCCTGGGC CTGGCTGTAC TCCTGGTGGG AGGTGTACGG GGAGCGCTAC 
GAGCCGTGCG CCATAACCGT GCGCTCCGGC GGGGAGCTCG CCGGGCTCGC GCCGCTCGCC 
CGGGAGCGGG GGACGGGGAG GGTGCTGTTC ATGGGCACCG GCCCGAGCGT CTACCTGGAC 
GTGCTGGCCC GGGGGGGCGA GGAGGCGGCG GTCGTCCGGG CGGTGGCGGG GCGGCTGCGG 
GAGGAGCTGC GGCCGTGGGA GGTGGCCGAC CTGCAGCACC TGCGGCCGCG GGCGGCCGCC 
CGGGGACTTC TCGAGGCGTG GCGGGGACCG GCGGCGAGCC TCTGGCAGAC AAACTGCCCC 
GTCCTCGAGG CGAGGCCCTT CGAGGAGCTG CTCGGCGCGC TCACCCAGAA GCAGCGGGGC 
AACGTTCGCC GCCTCGTCCG GCGCTCCGAG CGGGAGGGGG TGCGGGCCGT GGCCGCCGGG 
CCGGAGGAGG CCGCCGACGC CGCCTCCCGG ATGCTCGGGA TGCACCGGAA GGCCTGGCGG 
GAGCGCGGCA TAAACCCCGA GCACCTCAGC CCCCGCTTCG AGGTCCTGCT CAGGGCCGCC 
GCCGGGCGCC TCACCGCGAG GGGGCTCGGC TTCGTCTCCG AGTTCCGCCG GGGCGAGGAG 
GTGGTGGCCT CGCACCTCCT CCTCGTGGGG CACGACCGGG TGGGGGGCTA CCTCAGCGGG 
GCCACCGAGG AGGCCTTCCG GCGCTACGCC GTCTACCCGC TCTACGTCCG CGACGGGGTG 
GAGGCGGCCC GCTCGCGGGG CCTGGAGGCC TTCGACCTCA TGTGGGGCAG GGGCGAGCAC 
AAGCTGCAGT GGGGTCCCGA GATGGTCCCG AGCCGGCGTC TGGTCCTGGG CCGCAACCGG 
CTCCCGCTCT GGGCGCCCTA CGCCGGGCAC CACCTGCTCC GCTCCCGGGT CAAGGCCGCC 
GTGGACTCGG GCTCGGCCCC CCGGCCGGTG ATGCTGGCCG CCGAGGGCTA CCGGGCCGCG 
CGCCGCCTCA TCCGGCGGAG GGCCGCCGGA TGA

Protein sequence

MRILDESGAR ALTTSVARSG RELEALEAEW EALYAASPAA TPFQSWAWLY SWWEVYGERY 
EPCAITVRSG GELAGLAPLA RERGTGRVLF MGTGPSVYLD VLARGGEEAA VVRAVAGRLR 
EELRPWEVAD LQHLRPRAAA RGLLEAWRGP AASLWQTNCP VLEARPFEEL LGALTQKQRG 
NVRRLVRRSE REGVRAVAAG PEEAADAASR MLGMHRKAWR ERGINPEHLS PRFEVLLRAA 
AGRLTARGLG FVSEFRRGEE VVASHLLLVG HDRVGGYLSG ATEEAFRRYA VYPLYVRDGV 
EAARSRGLEA FDLMWGRGEH KLQWGPEMVP SRRLVLGRNR LPLWAPYAGH HLLRSRVKAA 
VDSGSAPRPV MLAAEGYRAA RRLIRRRAAG