Gene BMA10229_A2688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMA10229_A2688
Symbol	hmgA
ID	4792002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei NCTC 10229
Kingdom	Bacteria
Replicon accession	NC_008836
Strand	+
Start bp	2715390
End bp	2716742
Gene Length	1353 bp
Protein Length	450 aa
Translation table	11
GC content	67%
IMG OID
Product	homogentisate 1,2-dioxygenase
Protein accession	YP_001028640
Protein GI	124386559
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.515143
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGAGAA CGACAATCAT GACATTGGAT TTTTCGAAAC CGGGCGAAGC CGGCTATCAG 
AGCGGCTTCG CGAACGAATT CGCGACCGAG GCGCTGCCGG GCGCGTTGCC GCACGCGCGC 
AACTCGCCGC AGCGCGCGCC GTACGGGCTC TACGCGGAGC AGTTCTCCGG CACCGCGTTC 
ACCGCGCCGC GCGGCCACAA CCGCCGCTCG TGGCTGTACC GGATCCGGCC CGCCGCCGTG 
CATCGGCCGT TCGAGCTCGT GTCGGGCGAG CGCCGGATCG TCGCCGAGTT CGGCGATTCG 
GACGACGTGC CGCCGACGCC GCCGAACCAG TTGCGCTGGG ATCCGCTGCC GATGCCCGCG 
CAGCCGACCG ATTTCGTCGA CGGCTGGGTG ACGATGGCGG GCAACGGCTC GGCCGCCGCG 
ATGAGCGGCT GCGCGATCCA CCTGTACGCG GCGAACCGCT CGATGCGCGA GCGCTTCTTC 
TACAGCGCGG ACGGCGAGCT GCTGATCGTG CCGCAGGAAG GGCGCCTCTT CATCATGACG 
GAGCTCGGCC GGCTCGATGT CGAGCCGTTC GAGATCGCGG TGATCCCGCG CGGCGTGCGC 
TTCGCGGTCG CGCTGCCGGA CGGGCGCGCG CGCGGCTATG TGTGCGAGAA CTTCGGTGCG 
CTGCTCAGGC TGCCGGACCT CGGGCCGATC GGCTCGAACG GCCTCGCGAA TCCGCGCGAC 
TTCCTCACGC CGCACGCGTC GTACGAGGAT CGCGAAGGCG CGTTCGAGCT CGTCGCGAAG 
CTGAATGGCC GGCTCTGGCG CGCGGACATC GATCATTCGC CGTTCGACGT CGTCGCGTGG 
CACGGCAACT ACGCGCCGTA CAAGTACGAC CTGCGCCACT TCAACACGAT CGGCTCGATC 
AGCTACGATC ATCCGGACCC GTCGATCTTC CTCGTGCTGC AGTCGCAAAG CGATACGCCG 
GGCGTCGACG CGATCGACTT CGTGATCTTC CCGCCGCGCT GGCTCGCGGC CGAGGATACG 
TTCCGCCCGC CTTGGTTCCA CCGCAACGTC GCGAGCGAAT TCATGGGGCT CGTGCACGGC 
GTCTACGACG CGAAGGCCGA AGGCTTCGTG CCGGGCGGCG CGAGCCTGCA CAACTGCATG 
TCCGGCCACG GGCCCGACGC GGACACGTTC GAGAAGGCTT CTTCGATCGA CACGTCGAAG 
CCGAACAAGG TCGGCGACAC GATGGCGTTC ATGTTCGAGA CCCGCACGCT GATCCGGCCG 
ACGCGCTTCG CGCTCGACAC CGCGCAACTG CAGGCGAACT ACTTCGAATG CTGGCAAGGC 
CTCAAGAAAC ACTTCAATCC GGAGCAACGA TGA

Protein sequence

MERTTIMTLD FSKPGEAGYQ SGFANEFATE ALPGALPHAR NSPQRAPYGL YAEQFSGTAF 
TAPRGHNRRS WLYRIRPAAV HRPFELVSGE RRIVAEFGDS DDVPPTPPNQ LRWDPLPMPA 
QPTDFVDGWV TMAGNGSAAA MSGCAIHLYA ANRSMRERFF YSADGELLIV PQEGRLFIMT 
ELGRLDVEPF EIAVIPRGVR FAVALPDGRA RGYVCENFGA LLRLPDLGPI GSNGLANPRD 
FLTPHASYED REGAFELVAK LNGRLWRADI DHSPFDVVAW HGNYAPYKYD LRHFNTIGSI 
SYDHPDPSIF LVLQSQSDTP GVDAIDFVIF PPRWLAAEDT FRPPWFHRNV ASEFMGLVHG 
VYDAKAEGFV PGGASLHNCM SGHGPDADTF EKASSIDTSK PNKVGDTMAF MFETRTLIRP 
TRFALDTAQL QANYFECWQG LKKHFNPEQR