Gene BURPS1106A_3774 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3774
Symbol	hemB
ID	4901481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3687318
End bp	3688406
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	65%
IMG OID	640137000
Product	delta-aminolevulinic acid dehydratase
Protein accession	YP_001068004
Protein GI	126455399
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0113] Delta-aminolevulinic acid dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.342004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCTCGATC GCTATCATAT ACCATTGTCT CAAAAGTTTA CCGAAGGGAA CTGTAAGGTT 
TCGTCGGTTA CCTATCCCAG CCATTCCGCC ATGAGCATCC ATCCCCTGCA CCGCCCGCGC 
CGCATGCGCC GCGACGATTT CTCGCGACGC CTGATGCGCG AAAATATCCT CACCACGAAC 
GATCTGATCT ACCCGGTGTT CGTCGTCGAA GGCACGAACG TGCGCCAGCC GGTGCCGTCG 
ATGCCGGGCG TCGAGCGCGT GTCGATCGAT CTGCTGATGG GTGTCGCCGA GCAATGCGTC 
GAGCTCGGCG TGCCGGTCCT GTCGCTCTTT CCGGCCATCG AGCCGTCGCT GAAGACGCCC 
GACGGCCGCG AAGCGGCCAA TCCCGAAGGG CTGATCCCGC GTGCGGTACG CGAGCTGAAG 
CGCCGCTTCC CCGAACTCGG CGTGCTGACC GACGTCGCGC TCGATCCGTA CACGAGCCAC 
GGCCAGGACG GCGTGCTCGA CGAGGCCGGC TATGTGCTCA ACGACGAAAC GCTCGAGATT 
CTCGTCGAGC AGGCGCGCGC GCAGGCCGAA GCGGGTGTCG ACATCGTCGC GCCGTCGGAC 
ATGATGGACG GGCGCATCGG CGCGGTGCGC GAGATGCTCG AGCGTGAAGG CCACATCTAC 
ACGCGGATCA TGGCCTACTC GGCGAAGTAC GCGTCGGCGT TCTACGGCCC GTTCCGCGAC 
GCGGTCGGCT CCGCGTCGAA TCTCGGCAAG GGCAACAAGA TGACCTACCA GATGGACCCC 
GCGAACAGCG ACGAGGCGCT GCGCGAAGTG CGCCTCGACA TCGACGAGGG CGCGGACATG 
GTCATGGTGA AGCCCGGCAT GCCGTATCTC GACATCGTGC GCCGCGTGAA GGACGAATTC 
CGCTATCCGA CCTACGTCTA TCAGGTGAGC GGCGAATACG CGATGCTGAA GGCCGCCGCG 
CAGAACGGCT GGCTCGATCA CGACAAAGTC GTGCTCGAAT CGCTGCTCGC GTTCAAGCGC 
GCGGGCGCGG ACGGCATTCT CACGTACTTC GCGCTCGACG CGGCGCGGCT GCTGCGCGCG 
CAGAAGTAA

Protein sequence

MLDRYHIPLS QKFTEGNCKV SSVTYPSHSA MSIHPLHRPR RMRRDDFSRR LMRENILTTN 
DLIYPVFVVE GTNVRQPVPS MPGVERVSID LLMGVAEQCV ELGVPVLSLF PAIEPSLKTP 
DGREAANPEG LIPRAVRELK RRFPELGVLT DVALDPYTSH GQDGVLDEAG YVLNDETLEI 
LVEQARAQAE AGVDIVAPSD MMDGRIGAVR EMLEREGHIY TRIMAYSAKY ASAFYGPFRD 
AVGSASNLGK GNKMTYQMDP ANSDEALREV RLDIDEGADM VMVKPGMPYL DIVRRVKDEF 
RYPTYVYQVS GEYAMLKAAA QNGWLDHDKV VLESLLAFKR AGADGILTYF ALDAARLLRA 
QK