Gene BBta_1939 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_1939
Symbol
ID	5151645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	+
Start bp	2002463
End bp	2003464
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	68%
IMG OID	640556882
Product	putative fumarylacetoacetate hydrolase
Protein accession	YP_001238038
Protein GI	148253453
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0179] 2-keto-4-pentenoate hydratase/2-oxohepta-3-ene-1,7-dioic acid hydratase (catechol pathway)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.615073
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACTCG CAACCTATCG GAACGGCAGC CCCGATGGCG GCCTGCTCAT CGTCTCCCGG 
GATCAGGCGC GCGCGTGCAA TGCCAGCGCC ATCGCACCGG ATCTGCTGAC GGCGCTGCGG 
AATTGGCAGC AGGTCGAGCC GGCGTTGCGC CGGCTCGCCG AGAGCCTCGA GGATGGATCG 
GCTGCCGATG TGATGGCGTT CGATCCCACG CGATGCCTTG CACCGCTGCC GCGCGCACCG 
CAATGGCTGG ATGGCTCGGC CTTCCTGAAT CACGGACGGC TGATGGATGT CGCCTTCAAC 
AAGCCGCCGA TCCCCGACTT CGACACCATC CCGGTGATGT ACCAGGGCGC CAGCGACGAT 
TTCCTCGGGC CGCAGGCCGA CGTGCCCTTC GTGACGGAGG CGGATGGCAT CGACTTCGAG 
GGCGAGTTCG GCGTCATCGT CGATGATGTG CCGATGGCCG TGTCGCCAGA GCAGGCCGCG 
CAACGGATTC GGCTGCTGGT TCAGATCAAT GATTGGAGCC TGCGCGCGGT CGGTGCGCGC 
GAGGTGCGCA CCGGCTTCGG CTTCCTGCAG GCGAAGCCCT CGACGAGCTT CGCGCCGATG 
GCGGTGACTC CGGACGAGGT CGGCGACGCC TGGCGTGACG GCCGGCTCGA CATGGCCCTC 
CATGTTCACC GCAATGGCGA GCGGATCGGC GCGGCCTCAG GCCGCGAGAT GGCGTTCTCG 
TTTCCGCAAC TCATCGCCCA TGCCGCCCGG ACGCGGCGGT TGACGGCCGG CACGATCATC 
GGCTCGGGCA CGGTGTCGAA TGCCGATCGC GCCGCCGGAT CGAGTTGCCT GGCTGAGGTC 
AGGGCGATCG AGATGATCGA ACGCGGCGAG GCGCGCACGC CCTTCCTGCG CTTCGGTGAC 
GAGGTGACCA TGCAGGCCTG CTTCGCCGAT GGCCGGGGAG GCCCGTTCGG ACGCATCGCG 
CAGCGCGTGG TTCGTGCGGC GAGCACCGAT CGGCCGGAGT GA

Protein sequence

MRLATYRNGS PDGGLLIVSR DQARACNASA IAPDLLTALR NWQQVEPALR RLAESLEDGS 
AADVMAFDPT RCLAPLPRAP QWLDGSAFLN HGRLMDVAFN KPPIPDFDTI PVMYQGASDD 
FLGPQADVPF VTEADGIDFE GEFGVIVDDV PMAVSPEQAA QRIRLLVQIN DWSLRAVGAR 
EVRTGFGFLQ AKPSTSFAPM AVTPDEVGDA WRDGRLDMAL HVHRNGERIG AASGREMAFS 
FPQLIAHAAR TRRLTAGTII GSGTVSNADR AAGSSCLAEV RAIEMIERGE ARTPFLRFGD 
EVTMQACFAD GRGGPFGRIA QRVVRAASTD RPE