Gene BURPS668_3716 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3716
Symbol	hemB
ID	4882188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	3640199
End bp	3641197
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	66%
IMG OID	640129644
Product	delta-aminolevulinic acid dehydratase
Protein accession	YP_001060720
Protein GI	126440613
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0113] Delta-aminolevulinic acid dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.874214
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATCC ATCCCCTGCA CCGCCCGCGC CGCATGCGCC GCGACGATTT CTCGCGACGC 
CTGATGCGCG AAAATATCCT CACCACGAAC GATCTGATCT ACCCGGTGTT CGTCGTCGAA 
GGCACGAACG TGCGCCAGCC GGTGCCGTCG ATGCCGGGCG TCGAGCGCGT GTCGATCGAT 
CTGCTGATGG GTGTCGCCGA GCAATGCGTC GAGCTCGGCG TGCCGGTCCT GTCGCTCTTT 
CCGGCCATCG AGCCGTCGCT GAAGACGCCC GACGGCCGCG AAGCGGCCAA TCCCGAAGGG 
CTGATCCCGC GTGCGGTACG CGAGCTGAAG CGCCGCTTCC CCGAACTCGG CGTGCTGACC 
GACGTCGCGC TCGATCCGTA CACGAGCCAC GGCCAGGACG GCGTGCTCGA CGAGGCCGGC 
TATGTGCTCA ACGACGAAAC GCTCGAGATT CTCGTCGAGC AGGCGCGCGC GCAGGCCGAA 
GCGGGCGTCG ACATCGTCGC GCCGTCGGAC ATGATGGACG GGCGCATCGG CGCGGTGCGC 
GAGATGCTCG AGCGTGAAGG CCACATCTAT ACGCGGATCA TGGCCTACTC GGCGAAGTAC 
GCGTCGGCGT TCTACGGCCC GTTCCGCGAC GCGGTCGGCT CCGCGTCGAA TCTCGGCAAG 
GGCAACAAGA TGACCTACCA GATGGACCCC GCGAACAGCG ACGAGGCGCT GCGCGAAGTG 
CGCCTCGACA TCGACGAGGG CGCGGACATG GTCATGGTGA AGCCCGGCAT GCCGTATCTC 
GACATCGTGC GCCGCGTGAA GGACGAATTC CGCTATCCGA CCTACGTCTA TCAGGTGAGC 
GGCGAATACG CGATGCTGAA GGCCGCCGCG CAGAACGGCT GGCTCGATCA CGACAAGGTC 
GTGCTCGAAT CGCTGCTCGC GTTCAAGCGC GCGGGCGCGG ACGGCATTCT CACGTACTTC 
GCGCTCGACG CGGCGCGGCT GCTGCGCGCG CAGAAGTAA

Protein sequence

MSIHPLHRPR RMRRDDFSRR LMRENILTTN DLIYPVFVVE GTNVRQPVPS MPGVERVSID 
LLMGVAEQCV ELGVPVLSLF PAIEPSLKTP DGREAANPEG LIPRAVRELK RRFPELGVLT 
DVALDPYTSH GQDGVLDEAG YVLNDETLEI LVEQARAQAE AGVDIVAPSD MMDGRIGAVR 
EMLEREGHIY TRIMAYSAKY ASAFYGPFRD AVGSASNLGK GNKMTYQMDP ANSDEALREV 
RLDIDEGADM VMVKPGMPYL DIVRRVKDEF RYPTYVYQVS GEYAMLKAAA QNGWLDHDKV 
VLESLLAFKR AGADGILTYF ALDAARLLRA QK