Gene Achl_3549 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_3549
Symbol
ID	7295030
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	+
Start bp	3935477
End bp	3936472
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	68%
IMG OID	643591955
Product	fumarylacetoacetate (FAA) hydrolase
Protein accession	YP_002489594
Protein GI	220914285
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCAAGA TCGCCAGATG GAACCACGAC GGCGGGACGC AATCCGGCTT TGTCAGCGGC 
GGTGCCTGCC ACGCGTTGCC TGCGGGCCAG GACGTGCAAA CCCTGCTGGA CGCCGGCCTC 
GAGGAGACGC TGGCCATTGC CCGGCGGACC ATCGGTTCCG GCGCGGCGGT TCCGCTGGCG 
GACGTGCAGC TGCTCGCCCC GCTGGCGCCG GCCACCATCC GCGACTTCGT GGCGTTCGAG 
GAACACGTTG AGGGCGTCCG GAAGAGCATC GACGGCGTCG CCGGCGTGGT GCCCGAATGG 
TACGAGGCGC CCACGTTCTA CTTCACCAAC CCGCACACCG TGACCGGCAC GGGCGAGCTG 
ATTGGGATCC CAGCCGGGTG CGTGGACCTG GACTTCGAGA CCGAGGTGGC AGCCGTCGTC 
GGGCGCGTTC CCGGCAGCGA CGGCCGGAAC CTGGACACGG AGGCGGCGCA CCGGCACATC 
TTCGGCTACA CCGTCCTCAA CGACTGGTCC GCCCGGGACC TGCAGCGGCG CGAAATGAAG 
GTCAGCCTGG GACCGTGCAA AGGCAAGGAT TTCTCCAACA CCCTGGGCCC CTGGATCGTC 
ACCGCGGACG AGTTTGAGGA CCGGCACGAC GCGGAGGGGT TCCTGCCCAT CTCCATGTCC 
GTGGAGGTCA ACGGCGTACA GATCGGCCAG GACCTGCTCT CCAACATGGG CTGGCCGTTC 
GCCGAACTCG TGGCCTACGC GTCGCAGGAT TCGGTAATCC GGCCGGGCGA TGTACTGGGA 
TCCGGCACGT GTGGCAGCGG CTGCCTCGCC GAACTCTGGG GCCGAAACGG CGCCCAGACT 
CCCCCGCCGC TGGCAACCGG CGACGTGGTG CGCATGACCG TTGAAGGCAT CGGAACCATC 
GAAAACACCG TGGGCGATCG CCGCGAAGCC CTGACTCGGG TCCCCGCCCG GACTCGCCCC 
CGGAACCGGG TTGCCGCAGT GCTTCCGGCT ACCTGA

Protein sequence

MVKIARWNHD GGTQSGFVSG GACHALPAGQ DVQTLLDAGL EETLAIARRT IGSGAAVPLA 
DVQLLAPLAP ATIRDFVAFE EHVEGVRKSI DGVAGVVPEW YEAPTFYFTN PHTVTGTGEL 
IGIPAGCVDL DFETEVAAVV GRVPGSDGRN LDTEAAHRHI FGYTVLNDWS ARDLQRREMK 
VSLGPCKGKD FSNTLGPWIV TADEFEDRHD AEGFLPISMS VEVNGVQIGQ DLLSNMGWPF 
AELVAYASQD SVIRPGDVLG SGTCGSGCLA ELWGRNGAQT PPPLATGDVV RMTVEGIGTI 
ENTVGDRREA LTRVPARTRP RNRVAAVLPA T