Gene Namu_0529 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0529
Symbol
ID	8446112
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	588439
End bp	589644
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	76%
IMG OID	645039664
Product	fumarylacetoacetase
Protein accession	YP_003199936
Protein GI	258650780
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID	[TIGR01266] fumarylacetoacetase

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTTCCT GGGTGCCCGG TGCCGCCGGG TCGGGGTTCG ACGACGACCA CCTGCCGTAC 
GGGGTGTTCG ACGCGGGTGC CGGCCGCCGG GTGGGCGTGC GGATCGGCTC CTCCGTGCTC 
GACCTGGCCG CGGTGGCCGA CACCCCTGAG CTGGCCGGCG TTCTGGCGGC CGGTTCGCTG 
GATCCGCTGC TGGCCGCCGG CCCGGCGACC TGGGCGGCCG CCCGCTCCCT GGCGCACCGG 
GCGGTGACCG ATCCGGACTG CCGCACCCTC GTCGAGTCCC ACCTGCACCC GCTGGAGTCG 
GTGCGCCTGT TGCTGCCATT CACGGTCGCC GACTACGTCG ACTTCTACGC CAGCCAGTGG 
CACGCGACCG CGGTCGGCCG GATGTTCCGG CCGGACGCGG ACCCGTTGCC GCCCAACTGG 
AAACATCTGC CGATCGGCTA CCACGGCCGG GCCGGCAGCG TGGTCGTGTC CGGCACCCCG 
GTCAGCCGGC CCCGCGGGCA GACCCGGTTG CCCGGCGCGG CGCCGACGTT CGGTCCGACG 
CAGCGGCTGG ACCTGGAGGC GGAGGTCGCG TTCGTCGTCG GGGTCGGCTC GCCGCTGGGC 
TCCCCGGTGC CGGCCGGCGC GTTCGCCCGG CACGTGTTCG GCGTCGGCCT GCTCAACGAC 
TGGAGCGCCC GCGACATCCA GGCCTGGGAG TACCGCCCGC TCGGGCCGAT GCTCGGCAAA 
TCCTTTGCCA CTTCGGTCGG CCCCTGGATC ACCCCGCTCG CCGCGCTGGC CGCCGCCCGG 
GTCGCCCCGC CGCCGCGCAC CCACCGGCTG CTGCCCTACC TGGCCGACGA TGCCGGGCTG 
CCTTGGGGCC TGGATCTGGC CCTGACCGTC GAGGTGAACG GGACCGTGGT CAGCCGGCCG 
CCTTTCGCCG CCATGTACTG GACCGGGCCC CAGTTGATCG CGCACCTGAC CAGCAACGGC 
GCGCGCCTGC GCACCGGGGA TCTGCTGGCG TCCGGCACCG TGTCCGGGCC CGCCGCCGAC 
CAGGCCGGTT CGCTGCTGGA GCTCTCGGCC AACGGGACCC GGCCGGTGCC GCTGGGCGAC 
GGCACGTCGC GGACCTTCCT GGCCGACGGC GACGTCGTCA CGATCACGGC GACCGCCCCG 
TCGACCGGTG GCGGCCGGTT GACCCTGGGC GAGGTGACCG GGGCTGTGCG GCCGGCCGCG 
GGCTGA

Protein sequence

MASWVPGAAG SGFDDDHLPY GVFDAGAGRR VGVRIGSSVL DLAAVADTPE LAGVLAAGSL 
DPLLAAGPAT WAAARSLAHR AVTDPDCRTL VESHLHPLES VRLLLPFTVA DYVDFYASQW 
HATAVGRMFR PDADPLPPNW KHLPIGYHGR AGSVVVSGTP VSRPRGQTRL PGAAPTFGPT 
QRLDLEAEVA FVVGVGSPLG SPVPAGAFAR HVFGVGLLND WSARDIQAWE YRPLGPMLGK 
SFATSVGPWI TPLAALAAAR VAPPPRTHRL LPYLADDAGL PWGLDLALTV EVNGTVVSRP 
PFAAMYWTGP QLIAHLTSNG ARLRTGDLLA SGTVSGPAAD QAGSLLELSA NGTRPVPLGD 
GTSRTFLADG DVVTITATAP STGGGRLTLG EVTGAVRPAA G