Gene Rxyl_0254 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_0254
Symbol
ID	4116085
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	+
Start bp	259984
End bp	261150
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	74%
IMG OID	638035044
Product	phosphoribosylaminoimidazole carboxylase
Protein accession	YP_643043
Protein GI	108803106
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGCCGGA CCATCCTCCC CGGGAGCACG GTCGGCGTGC TGGGCGGCGG CCAGCTCGGT 
CGCATGCTGG CGCTTGCGGG CGGCCACATG GGCTACCGGT TCGTGGTGCT CGACCCGACG 
CCCAACGCCC CCGCCGGGCA GGTCTCGAGC GGCCAGGTCG TGGCCGCCTA CGACGACCGC 
GAGGCCGCCG GCAGGCTCGC CGCCTCCTCC GACGTGATCA CCTACGAGTT CGAGAACGTG 
GACGCCGGGG TGGCCGGGAT GCTGGAGCGG GAGGCGTACG TCCCCCAGGG GAGCCGGCTG 
CTGCACACCA CCCAGCACCG GCTGCGCGAG AAGCGGGCCG TGGAGGAGGC GGGGGTGCGG 
GTCGCCCCCT ACGAGCCGGT GCGAGACGGC GAGGACCTGC GGGCCGCGCT GCGGCGCCTC 
GGCACCCCCT GCGTGCTCAA GACCGCCACG GGCGGCTACG ACGGCAGGGG CCAGCGCGTC 
ATCCGCTCCG AAGACGAGGC CCCGGCGGCC CTCTCGGAGC TCTCCGGGGA GGGGACCGAG 
CTGGTGCTGG AGCGCTTTGT CCGCTTCGAG AAGGAGCTCT CGGTCATCGC CGCCCGCACC 
CCCGGGGGGG AGGTCCGGAC CTTCCCCCCC GCCGAGAACG TCCACGTGGA CAACATCCTC 
CACCTCTCCA TCGTCCCCGC CCGCATCCCG CGGGAGGTGC AGGAGGAGGC CCGGCGGATG 
GCGGTGCGCG TGGCCGAGGG GCTCGGCGTG GTGGGGCTCG TCGCCGTGGA GATGTTCTGG 
GCCGGCGGCG ACGGGCTCTA CGTCAACGAG CTCGCCCCCC GCCCCCACAA CTCCGGCCAC 
TACACCATAG AGGCCTGCGC CACCTCCCAG TTCGAGCAGC ACCTCAGGGC CATATGCAAC 
CTGCCGCTCG GGCCGACCGA CCTCCTCACC CCCGCCGTGA TGGTGAACGT GCTGGGCGAG 
CATCTGGAGC CGCTCGTCCG CGCGCTCTCG GAGGGGAGGA TCGCCGCCCG CGGCGGGGCG 
GTGCCGAAGG TCCACCTCTA CGGCAAGGCC GAGTCGCGCC CCAAGCGGAA GATGGGCCAC 
GTGACCCTCC TCGCCCCGGA GACGGGCGCC GCCCTCCGGT GGGTCGAGGA GAGCGGCCTC 
TGGAAGGCGC AGGGAGGGGC CGCCTAG

Protein sequence

MSRTILPGST VGVLGGGQLG RMLALAGGHM GYRFVVLDPT PNAPAGQVSS GQVVAAYDDR 
EAAGRLAASS DVITYEFENV DAGVAGMLER EAYVPQGSRL LHTTQHRLRE KRAVEEAGVR 
VAPYEPVRDG EDLRAALRRL GTPCVLKTAT GGYDGRGQRV IRSEDEAPAA LSELSGEGTE 
LVLERFVRFE KELSVIAART PGGEVRTFPP AENVHVDNIL HLSIVPARIP REVQEEARRM 
AVRVAEGLGV VGLVAVEMFW AGGDGLYVNE LAPRPHNSGH YTIEACATSQ FEQHLRAICN 
LPLGPTDLLT PAVMVNVLGE HLEPLVRALS EGRIAARGGA VPKVHLYGKA ESRPKRKMGH 
VTLLAPETGA ALRWVEESGL WKAQGGAA