Gene BMA0649 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA0649
Symbol	hutI
ID	3089468
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei ATCC 23344
Kingdom	Bacteria
Replicon accession	NC_006348
Strand	+
Start bp	675742
End bp	676965
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	72%
IMG OID	637561466
Product	imidazolonepropionase
Protein accession	YP_102427
Protein GI	53725645
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID	[TIGR01224] imidazolonepropionase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATCGA TTCTCTGGCA CAACCTGAAG CTGTGCGCGC ACGGCGACCC GAACGACACG 
ATCGCGGATG CGGCGATCGC GGTGAACGGC GACGGCACGA TCGCCTGGAC CGGGCGCGCG 
AGCGACGTGC CGGCCGGCTA CGTGCACTGG CCGCGCGAGG ACCTGCGCGG CGCATGGGTG 
ACGCCCGGCC TCGTCGATTG CCACACGCAC CTCGTCTACG GCGGCCAGCG CGCGGACGAG 
TTCGCGCAGC GCCTGGCGGG GGCGAGCTAC GAGGAGATCG CGCAGCGCGG CGGCGGCATC 
GTATCGACCG TGCGCGCGAC GCGCGACGCG AGCGAGGCGG CGCTGTTCGA GCAGGCGTGC 
GCGCGGCTGC GGCCGCTCCT TGCCGAGGGC GTGACCGCGA TCGAGATCAA GTCCGGCTAC 
GGGCTCGAAC TCGCGAGCGA GCGGCGGATG CTGCGCGTCG CGCGGCAGCT CGGCGAGCGC 
TTTCCGGTGA GCGTCTATAC GACGTTCCTC GGCGCGCACG CGCTGCCGCC CGAGTACGCG 
GGCCGCGCGG ACGAATATAT CGACGAGGTT TGCGAACGGA TGCTGCCCGC GCTCGCCGAC 
GAAGGGCTCG TCGACGCGGT CGACGTGTTT TGCGAGCGGA TCGGCTTCAC GCTCGCGCAG 
AGCGAGCGCG TGTTCGAAGC GGCGGCGCGG CGCGGGCTGC CCGTCAAGAT GCACGCGGAG 
CAGTTGTCGA ACGGCGGCGG CTCCGCGCTC GCCGCGCGCT ATCGCGCGCT GTCGGCCGAC 
CACCTCGAAT ATCTGGACGC GGCGGGCGTT GCCGCGATGC GTGCATCGGG CACGACGGCC 
GTGCTGCTGC CGGGCGCGTA CTACTTCATC CGCGAGACGA AGCTGCCGCC GATCGATCTG 
CTGCGCCGCC ACGGCGTGCC GATCGCGCTC GCGACCGATC ACAATCCGGG CACCTCGCCG 
CTCACGTCGC TGCTGCTCAC GATGAACATG GGCTGCACGG TGTTCAAGCT GACCGTGCAG 
GAGGCGCTCC TCGGCGTCAC GCGCCACGCG GCGGCGGCGC TCGGCGCGAG CGACCGGCAC 
GGCTCGCTCG CGCCCGGGCG GCAGGCGGAT TTCGCGGTAT GGTCGGTCTC GACGCTCGCC 
GAGCTCGCGT ACTGGTTCGG CCGGCCGCTG TGCGAGCGGG TCGTGAAGGG CGGCGTGACG 
GTGTTCACGC GCGATGCGCG CTGA

Protein sequence

MKSILWHNLK LCAHGDPNDT IADAAIAVNG DGTIAWTGRA SDVPAGYVHW PREDLRGAWV 
TPGLVDCHTH LVYGGQRADE FAQRLAGASY EEIAQRGGGI VSTVRATRDA SEAALFEQAC 
ARLRPLLAEG VTAIEIKSGY GLELASERRM LRVARQLGER FPVSVYTTFL GAHALPPEYA 
GRADEYIDEV CERMLPALAD EGLVDAVDVF CERIGFTLAQ SERVFEAAAR RGLPVKMHAE 
QLSNGGGSAL AARYRALSAD HLEYLDAAGV AAMRASGTTA VLLPGAYYFI RETKLPPIDL 
LRRHGVPIAL ATDHNPGTSP LTSLLLTMNM GCTVFKLTVQ EALLGVTRHA AAALGASDRH 
GSLAPGRQAD FAVWSVSTLA ELAYWFGRPL CERVVKGGVT VFTRDAR