Gene BURPS1106A_3326 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3326
Symbol	hmp
ID	4901181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3249671
End bp	3250870
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	68%
IMG OID	640136552
Product	flavohemoprotein
Protein accession	YP_001067563
Protein GI	126453088
COG category	[C] Energy production and conversion
COG ID	[COG1017] Hemoglobin-like flavoprotein [COG1018] Flavodoxin reductases (ferredoxin-NADPH reductases) family 1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000871976
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCCG AGCAAATGGC CCGAGTGAAA GCGACCGCCC CGGTTCTCGC GGAGCACGGC 
GCGACGATCA CGAAGCACTT TTATCAGCGG ATGTTCGGGC GCCACCCCGA GCTGAAGAAC 
GTTTTCAACC AGACGCACCA GAAGACGGGC AGCCAGCCGG AGACGCTCGC GAAGGCGGTC 
TACGCATACG CGGCGAACAT CGACAATCTC GGCGCGCTCG GCGGCGCCGT GTCGCGGATC 
GCGCACAAGC ACGCGAGCCT GAACATCCGG CCGGAGCACT ACCCGATCGT CGGCGAGAAC 
CTGCTCGCCT CGATCGTCGA GGTGCTCGGC GACGCGGTGG ACGCGGACAC GCTCGAAGCG 
TGGCGCATCG CGTACGGCCA GCTCGCCGCG ATCCTGATCG GCGCGGAGGC GAACCTGTAC 
GAGAACGCCG CATGGAGCGG CTTCCGCCCG TTCAAGGTCG CGAAGAAGGT GCGCGAGAGC 
GACGAGATCA CGTCGTTCTA CCTGACGCCC GCCGACGGCG GCGCGGCGCC CGGGTTCGAG 
CCGGGCCAGT ACATCTCGGT GAAGCGTTTC GTCGGCGACA TGGGCGTCGA TCAGCCGCGT 
CAGTACAGCC TGTCCGACGC GCCGCACGGC AAGTGGCTGC GCATCTCGGT CAAGCGCGAG 
GCGGGGCACA GCGAGGCGGT GCCGGCGGGC AAGGTGTCGA CGCTGATGCA CGACGGCGTC 
GACGTCGATT CGGTCGTCGA AGTCACCGCG CCGATGGGCG ATTTCACGCT GAACCGCCAT 
GCGGCGACGC CCGTCGTGCT GATTTCGGGC GGCGTCGGGA TCACGCCGAT GATGTCGATG 
GCGTCGACGC TCGTCGCAGC GGGCAGCGAG CGCGAAGTGC GTTTCCTGCA CGCGTGCCGC 
GCGGCGAACG TGCATGCGTT CCGCGACTGG CTGAACGACA CGACGGACGC GCATCCGAAC 
GTGAAGCGCG CGGTGTTCTA CGAGGTGGTC GGCCCGAACG ACCGCGTGGG CGTCGATCAC 
GACCACGAAG GCCGGATCAC GCCGGCTGCG CTCGAGCGCC ACGCGCTCGT GCCGGACGCC 
GATTACTACA TCTGCGGGCC GATCGCGTTC ATGAAGCAGC AGCGCGACGC GCTCGTTGCG 
CTCGGCGTCG CGCCGGAGCG CGTGCAGACG GAAATCTTCG GTTCGGGCGC GCTCGAATGA

Protein sequence

MTAEQMARVK ATAPVLAEHG ATITKHFYQR MFGRHPELKN VFNQTHQKTG SQPETLAKAV 
YAYAANIDNL GALGGAVSRI AHKHASLNIR PEHYPIVGEN LLASIVEVLG DAVDADTLEA 
WRIAYGQLAA ILIGAEANLY ENAAWSGFRP FKVAKKVRES DEITSFYLTP ADGGAAPGFE 
PGQYISVKRF VGDMGVDQPR QYSLSDAPHG KWLRISVKRE AGHSEAVPAG KVSTLMHDGV 
DVDSVVEVTA PMGDFTLNRH AATPVVLISG GVGITPMMSM ASTLVAAGSE REVRFLHACR 
AANVHAFRDW LNDTTDAHPN VKRAVFYEVV GPNDRVGVDH DHEGRITPAA LERHALVPDA 
DYYICGPIAF MKQQRDALVA LGVAPERVQT EIFGSGALE