Gene M446_2533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_2533
Symbol
ID	6134689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	2808341
End bp	2809651
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	73%
IMG OID	641642745
Product	fumarylacetoacetase
Protein accession	YP_001769410
Protein GI	170740755
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID	[TIGR01266] fumarylacetoacetase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGACA TCGACGCCAC CCACGCCGCG ACCTTGCGCT CCTGGGTGCC CGGCGCGAAC 
GGCCACTCGG ACTTTCCGAT CCAGAACCTG CCGCTCGGGG TGTTCTCGCC GGGTGACGGG 
ACGCCGCGGG CGGGCGTCGC GATCGGCGGG CGCATCCTCG ACTTGCCGGC GCTGCTTGCC 
GCGAACCTCC TCTCGGGCGA GGCCGCGCTC GCCGCCGAGG CCGCGGGCGG GACGACGCTC 
AACAGGCTCC TTGCCTTGGG GGCGGGGCCG CGCCGGGCGC TGCGGGCGCG CCTGTCAGCC 
CTGTTCGCGG AGGGCTCGCC GGATCGCGAC CGGGTCGCGC CCCTGCTGCA TGAGGCCTCG 
TCCTGCCGGC TCCACCTGCC GGCCGCGATC GGCGACTACA CCGACTTCTA CGTCGGTATC 
CACCACGCGG AGAATATCGG CCGGCAATTC CGGCCGGACA ACCCGCTCCT GCCGAACTAC 
AAGCACGTGC CGATCGGCTA CCACGGCCGC GCCTCCTCGA TCCGGCCCTC GGGCACCCCG 
GTGCGGCGCC CGCGCGGGCA GTCAAAGCCG CCGGAGGCGG GCGACCCGGT CTTCGGCCCC 
TCGCGGCGAC TCGACTACGA ACTCGAACTC GGGGTGTGGA TCGGCCCCGG CAATACTCTC 
GGCGAGCCGA TCGCGATCGG CGACGCGCAC GCGCACATCG CGGGCGTGTG CCTCCTCAAT 
GATTGGTCGG CGCGGGACAT CCAGGCGTGG GAGTACCAGC CGCTGGGACC GTTCCTCGCC 
AAGAACTTCG CCACGACGAT CTCGCCCTGG ATCGTCACGG CGGAGGCGCT CGCACCCTTC 
CGGATCGCGC AGAGCCCCCG GCCGGAGGGC GATCCGCGGC CGCTGCCCTA CCTAACCGAC 
GAGGTCGACC AGCGAAGGGG CGCCTTCGAC CTCCGGCTCG AGGTGCTGCT GCTGACGCCC 
GGCCTGCGAG CGGCGGGCCT CGGCCCCCAC CGGATTTCGG CCTCGAACAC GCGGCACATG 
TACTGGACCG TGGCGCAGAT GGTGGCCCAC CACACCGGCG GCGGCTGCAA CCTGCAGCCG 
GGCGACCTGC TCGGGACGGG CACGATCTCC GGCCCGGACC GCGACGCCTG CGGCAGCCTC 
CTCGAAGCGA CCCTCGGTGG CCGGGAGCCG CTCCGGCTCG CGTCGGGCGA GGAGCGCCGG 
TTTCTGGAGG ACGGCGACGA GGTGATCCTG CGGGCACGCG GCGTCCGCGA CACCTTCGCG 
CCGATCGGCT TCGGCGAGTG CCGGGCGGAG CTCCTTGGAG CGGCGCCCTG A

Protein sequence

MADIDATHAA TLRSWVPGAN GHSDFPIQNL PLGVFSPGDG TPRAGVAIGG RILDLPALLA 
ANLLSGEAAL AAEAAGGTTL NRLLALGAGP RRALRARLSA LFAEGSPDRD RVAPLLHEAS 
SCRLHLPAAI GDYTDFYVGI HHAENIGRQF RPDNPLLPNY KHVPIGYHGR ASSIRPSGTP 
VRRPRGQSKP PEAGDPVFGP SRRLDYELEL GVWIGPGNTL GEPIAIGDAH AHIAGVCLLN 
DWSARDIQAW EYQPLGPFLA KNFATTISPW IVTAEALAPF RIAQSPRPEG DPRPLPYLTD 
EVDQRRGAFD LRLEVLLLTP GLRAAGLGPH RISASNTRHM YWTVAQMVAH HTGGGCNLQP 
GDLLGTGTIS GPDRDACGSL LEATLGGREP LRLASGEERR FLEDGDEVIL RARGVRDTFA 
PIGFGECRAE LLGAAP