Gene Caul_0418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caul_0418
Symbol
ID	5897692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caulobacter sp. K31
Kingdom	Bacteria
Replicon accession	NC_010338
Strand	-
Start bp	457914
End bp	458879
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	64%
IMG OID	641560904
Product	fumarylacetoacetate (FAA) hydrolase
Protein accession	YP_001682053
Protein GI	167644390
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.994825
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACTCG TCACCTTTAG AAGCGGCCAA GAGACCACCG ATCGGGTCGG CGCGCTGATC 
GACGACGACC AGATCCTTGA ATTCACCGAT GGTTCGGGGC AGGCGCTCTA TCCGAGCCTG 
TTAGCCTTGA TCCAGGCGGG CGCGCCCGCC TGGGACGCGG CGCGAGAGGC GCTGGCCGCC 
AAGCGCGGAC GTCTGCACGC GCGTTCGGCG ACAGCCTTGC GCGCCCCCCT TCCGCTGCCG 
CCGCAATATC GCGACGCGAT GGTGTTCCAT AAGCACATTC TACAGAGCGG CCGCGCCATG 
AGCGCGATGC GGGCCAAACA GCTGGGAACG CCCGAAGCCC TCGCCGAGGC CGAGGCGGCC 
GCCAAGGCGA CCGAGGTTCC CGAGATCTAC AAACTCCAGC CCTTCTACTA CAAGGGCAAC 
CGCTTCGCCG TTGGCCATCC CGATCAGGAC ATTGTCTGGC CAGCCTACAG CCAGGTGATC 
GACTTTGAGC TGGAGCTGGC CTGCGTCATC GGCAAGGGCG GCAAGGACAT CGCCCGCGAA 
GACGCCTTCG AGCACGTCTT CGGCTTCATG ATCCTCAACG ACTTGTCGGC CCGCGACGCC 
CAGGCGCCCG AAATGCTGGC GCGCCTAGGC CCGGCCAAGG GCAAGGATTT CGACAACGCC 
AATGTGTTCG GCCCCTGCCT GGTCACCCTG GATGAGATTG GCGATCCCTA CGACCTGCGC 
ATGACGGCGC GGATCAATGG CGAGCAATGG ACCGAGGGTT GGTCCGGCGA CATGGGCTTC 
AATTTCCACG ACCTGATCGC CCACATCTCT CGGGGCGAGA CCCTCCATCC GGGCGAGATC 
ATCGGCTCGG GCACGGTCGG CGACGGCTGC GGTCTAGAGC ACATGCGCTT CCTCAAGGAA 
GGCGACGTCA TCGAGCTGGA GATCGAGAAG ATCGGGATCC TACGCAACCG CATCATTCGG 
AGCTGA

Protein sequence

MRLVTFRSGQ ETTDRVGALI DDDQILEFTD GSGQALYPSL LALIQAGAPA WDAAREALAA 
KRGRLHARSA TALRAPLPLP PQYRDAMVFH KHILQSGRAM SAMRAKQLGT PEALAEAEAA 
AKATEVPEIY KLQPFYYKGN RFAVGHPDQD IVWPAYSQVI DFELELACVI GKGGKDIARE 
DAFEHVFGFM ILNDLSARDA QAPEMLARLG PAKGKDFDNA NVFGPCLVTL DEIGDPYDLR 
MTARINGEQW TEGWSGDMGF NFHDLIAHIS RGETLHPGEI IGSGTVGDGC GLEHMRFLKE 
GDVIELEIEK IGILRNRIIR S