Gene Cagg_3806 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3806
Symbol
ID	7266286
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4642680
End bp	4643927
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	58%
IMG OID	643568618
Product	fumarylacetoacetase
Protein accession	YP_002465078
Protein GI	219850645
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID	[TIGR01266] fumarylacetoacetase

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.020804
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.595567
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACTGC AAAGCTTTGT TTCTATTACA CCTGACAGTG ATTTTCCGCT CGAAAATCTG 
CCCTACGGTG TCTTCCGTCT GCGTAGTGGC GGTACGGCGC GGGTCGGGGT GGCGATTGGT 
GAATACGTGC TCGATCTCGC AGTGCTCGAT GAGGCCGGTT TGTTGGCTTC GACGCCGGTG 
GCCGGGCAAG GGTTGTTTAC CCGTGATTCC CTTAACGGAT TTATGGCTGC GGGTCCGGCG 
GCGTGGCAGG CAGTGCGCAA CACGCTGCAA CGGCTGCTCG CTGCCGATGA GCCAACGTTA 
CGCGATCACC AGCCGCTGCG CGACGCCGCG CTGATCCGGC AAAGCGAGGT TGAGCTGCTG 
CTGCCGGTGC AGATCGGCGA TTTCACCGAC TTCTATTCGT CGCTTTACCA TGCCACCAAC 
ACCGGCAAGA TGCTGCGTCC CGATAGTCCT CCACTTTACC CGAATTGGCG GCATATGCCG 
GTAGCGTACC ATGGTCGGGC TAGTACCGTG GTAGTTAGCG GTACACCGAT TCGCCGTCCC 
TGTGGTCAGA TCAAGCCGTC GCGTAGCCCA GAACCGTTCT TTTCACCGTC ACGTGCCCTC 
GATTTCGAGG TTGAGTTGGC GATGGTTATC GGTGTGGGTA GCGAGTTAGG GGTGCCGGTA 
CCGATTGCGC AGGCTGAAGA GCACATCTTT GGCTTTGTGA TCCTCAATGA CTGGAGCGCG 
CGTGATATTC AGGGGTGGGA GTATCAGCCG CTTGGCCCCT TCTTGTCAAA GAATTTTGCG 
ACAACGATTA GCCCGTGGGT AGTTCCACTC GCAGCACTCG AACCGTTCCG CTGTAGTGGT 
GAGCCGCAAG ACCCGCCACC GTTGTCGTAT CTGCAACCGC CACGACCGGG ACATTTTGAT 
GTCACGCTCG AAGTTTGGCT CAACGATACG CGCATCTGCC AGACCAATGC TCGTCATCTG 
TACTGGAGCT TTGCCCAGCA GCTTGCACAT CATACGGTGA ATGGTTGTCG GTTGCGGCCC 
GGTGACCTTA TGGGTTCGGG AACGATCAGT GGTCCAACGA AGGAGTCGCG GGGTTGTTTG 
TTTGAGTTGA CGTGGCGTGG TACCGAGCCG ATCCAACTGG CCGATGGTTC AACGCGGCGT 
TGGTTGGAGG ATGGCGATAC GGTAACGATG CGCGCATGGG CGCAGGGTGA TGGGTACCGC 
ATCGGGTTTG GCGAGGCGAC GGGGACGATC GTGGCAAATT CACCGTAG

Protein sequence

MPLQSFVSIT PDSDFPLENL PYGVFRLRSG GTARVGVAIG EYVLDLAVLD EAGLLASTPV 
AGQGLFTRDS LNGFMAAGPA AWQAVRNTLQ RLLAADEPTL RDHQPLRDAA LIRQSEVELL 
LPVQIGDFTD FYSSLYHATN TGKMLRPDSP PLYPNWRHMP VAYHGRASTV VVSGTPIRRP 
CGQIKPSRSP EPFFSPSRAL DFEVELAMVI GVGSELGVPV PIAQAEEHIF GFVILNDWSA 
RDIQGWEYQP LGPFLSKNFA TTISPWVVPL AALEPFRCSG EPQDPPPLSY LQPPRPGHFD 
VTLEVWLNDT RICQTNARHL YWSFAQQLAH HTVNGCRLRP GDLMGSGTIS GPTKESRGCL 
FELTWRGTEP IQLADGSTRR WLEDGDTVTM RAWAQGDGYR IGFGEATGTI VANSP