Gene Rcas_0439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0439
Symbol
ID	5537902
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	553088
End bp	554110
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	60%
IMG OID	640892602
Product	fumarylacetoacetate (FAA) hydrolase
Protein accession	YP_001430588
Protein GI	156740459
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.674991
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCTGG TCACCTTTCA GTTTATCGAC AGGCAACCGC GTGTCGGGGT AGTGATTGGC 
GACACCATCA TCGACCTGGC AGCTGCCGCG CCGCTGGTGT TCGACGATCC GCCTCCGCCT 
CCCTGGCGCC TGCTCGATGT GCTGGAAGGA ATGCCGGATG GGATGGGTCT CGATGGGGCG 
GCAGAAATTG TGGCGGCGGT GATCGATCAG ATCGGCGGCG CCGATGACGA GGGAATGGAA 
ACGTCACGGT ATGGACCGTT GACGATTGGT GGTGTCGAGA TGCTCATCCC GCTCGATGAA 
GCGCACCTGC TGGCGCCGCT GCCCCGACCC CCAAGTCTGC GTTGCTTCGA GGCGAGCGAG 
CGGCATATGG CTGCGCTTGC CCGTCTGCAT GGCGGTGGCA TGCCGTACTA CTGGTACGAA 
CGCCCAATCT TCGCGTTCGG CAACCATGCT GCTATCTACG GTCCCGACGC GAAGATACCG 
CTGCCGCGCA CCACAGCGTT CGATTACGAA CTCGAAGTCG CGTGTGTTAT TGGTCGTGCA 
GGGCGCGATA TTCCTCTCGA TGAGGCGAAT GATTACATTG CCGGGTACGT GTTGCTCAAC 
GATTGGACGG CGCGTGACGT TCAGCACGAA GAACTGATCG CAGGGTTCGC TTTCAGCAAA 
AGCAAGGATG CCGCCACATC GCTCGGACCC TGGCTTGCCA CACCGGATGA ACTGGATGAG 
TACACCCTTG ATGGCGGGCA TTTCAATCTC ACATTGATCG CTCGTGTCAA TGGCATCGAA 
CAGTCACGCG GCAACCTCCG CGATCTGGCG TACACCTTTG CGCAGATGGC TGCTGCTGCT 
TCGCAGGATT GCACCCTCTA TCCCGGCGAC ATCATTGCCT GTGGCGCGAT CGGCGGCTCG 
CTCCTCGAGG CGACTGATGG GCAGGGTCCG TGGATCGAAC CCGATGATCT GGTCGAACTT 
GAAGCCGCCG GTCTCGGCGT TCTCCGAAAC CGCATTGTTG TGCGAGACTT CCTGCGTGCG 
TGA

Protein sequence

MRLVTFQFID RQPRVGVVIG DTIIDLAAAA PLVFDDPPPP PWRLLDVLEG MPDGMGLDGA 
AEIVAAVIDQ IGGADDEGME TSRYGPLTIG GVEMLIPLDE AHLLAPLPRP PSLRCFEASE 
RHMAALARLH GGGMPYYWYE RPIFAFGNHA AIYGPDAKIP LPRTTAFDYE LEVACVIGRA 
GRDIPLDEAN DYIAGYVLLN DWTARDVQHE ELIAGFAFSK SKDAATSLGP WLATPDELDE 
YTLDGGHFNL TLIARVNGIE QSRGNLRDLA YTFAQMAAAA SQDCTLYPGD IIACGAIGGS 
LLEATDGQGP WIEPDDLVEL EAAGLGVLRN RIVVRDFLRA