Gene Rxyl_2241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rxyl_2241
Symbol
ID	4115190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rubrobacter xylanophilus DSM 9941
Kingdom	Bacteria
Replicon accession	NC_008148
Strand	-
Start bp	2250906
End bp	2251955
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	69%
IMG OID	638037026
Product	fumarylacetoacetate (FAA) hydrolase
Protein accession	YP_644989
Protein GI	108805052
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGATCAG AGGATTCCCC GAGGGGCTGG TTCGCGCTCG GGACCTTCGA GCACGGAGGG 
CTCGCCTTCC CGGGCCTCGT GCTCGAGGGC GGGCGGGTGG TCGACCTCTC CAGGACGGAG 
GTCCCCGGTG CTAGCGTGGC GAGCTTCCGC TCGGTTCGCC AGATCCTCGA GGGCTGGGAG 
GCGAACCGTG CGGCGCTGGC CGCCTTCGCG AGGCATGGAG CGGCAGACGC CCACGACCTC 
GCCGATCTGC GGGTCCTGCC GCCCGTCGAG CCGGTCCAGA TCCTGCAGAG CGGGGCCAAC 
TACCACAGGC ACGTCGTGGA TCTCATCGTC GCCGAGGCGC GGGCCGGGAA CCCCCGGATG 
ACACCCGAGG AGGAGGCGGA GGTGCGCCGG GCCGGCGAGA GGCTCATGGA CGAGCGCGCA 
GAGCGCGGAG AGCCCTACCT CTTTCTCGGT TCCCCGACCG CCCTGTGTGG CCCCTACGAC 
GATGTGGTGC TCCCCGCGGA GGGCGATCAG CACGACTGGG AGCTCGAGTT CGCGGCTGTC 
ATCGGCAGGA GCGGGCGTCA CGTGCCCCCC GAGCGTGCTC TCGACCTCGT CGCCGGGTAT 
ACGATCGCGA ACGACATCAC CACCCGCGAT CTCGTCTACC GTCCGGACCT CAAGGCTATC 
GGCACCGACT GGCTGCGCTC CAAGAACGCG CCTACTTTCC TTCCGACCGG TCCCTACATC 
GTCCCCAAGG AGTTCGTCGG CGACACCAGC GGCCTGCGCA TCACGCTCAG GCTCAACGGC 
GAGACCATGC AGGACGAGTC TGCCTCGGAC ATGATCTTCG ACGTAGCGCG CCTCGTCTCC 
TACGCATCAT CCCGGGTCTT GCTCCGGCCG GGAGACCTGA TCCTCACCGG CTCTCCCGCG 
GGCAACGGCT CTTACTGGGG ACGTTTTCTC GGGGAGGGTG ACGTCATGGA GGGGACCGTC 
ACCGGCCTCG GGTATCAGCG GAACCGCTGC GTCAGGGAAC GGCTACCGGA GGCGGCGCCC 
GGTCGAGTTC CCGATGGGTC GGCGACATGA

Protein sequence

MRSEDSPRGW FALGTFEHGG LAFPGLVLEG GRVVDLSRTE VPGASVASFR SVRQILEGWE 
ANRAALAAFA RHGAADAHDL ADLRVLPPVE PVQILQSGAN YHRHVVDLIV AEARAGNPRM 
TPEEEAEVRR AGERLMDERA ERGEPYLFLG SPTALCGPYD DVVLPAEGDQ HDWELEFAAV 
IGRSGRHVPP ERALDLVAGY TIANDITTRD LVYRPDLKAI GTDWLRSKNA PTFLPTGPYI 
VPKEFVGDTS GLRITLRLNG ETMQDESASD MIFDVARLVS YASSRVLLRP GDLILTGSPA 
GNGSYWGRFL GEGDVMEGTV TGLGYQRNRC VRERLPEAAP GRVPDGSAT