Gene BURPS1106A_1077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1077
Symbol	hemC
ID	4902015
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	1058658
End bp	1059647
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	73%
IMG OID	640134307
Product	porphobilinogen deaminase
Protein accession	YP_001065357
Protein GI	126455102
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0181] Porphobilinogen deaminase
TIGRFAM ID	[TIGR00212] porphobilinogen deaminase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.941716
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTCCG AGACTCTTCC GGCCGAGCTG CCCGCGACGC TGACGATCGC GTCGCGCGAG 
AGCCGCCTCG CCATGTGGCA AGCCGAGCAT GTGCGTGATG CGCTGCGCAA ATTATATCCA 
GCTTGTGACG TGAAAATCCT CGGGATGACG ACGCGCGGCG ATCAAATTCT CGATCGCACG 
CTATCGAAGG TCGGCGGCAA GGGCCTGTTC GTCAAGGAGC TCGAGAGCGC GCTCGCCGAC 
GGCCGCGCGG ATCTCGCCGT GCATTCGCTG AAGGACGTGC CGATGGCGCT GCCCGAAGGC 
TTCGCGCTCG CGGCGGTGAT GAGCCGCGAG GATCCGCGCG ACGCGTTCGT GTCGAACGAT 
TACGCGTCGC TCGACGCGCT GCCGGCGGGC GCCGTCGTCG GCACGTCGAG CCTGCGCCGC 
GAGGCGATGC TGCGCGCGCG CCATCCGCGG CTCGACGTGC GGCCGCTGCG CGGCAATCTC 
GACACGCGGC TCGCGAAGCT CGACCGCGGC GATTACGCGG CGATCATCCT CGCCGCCGCG 
GGCCTCAAGC GTCTCGGCCT CGCCGCGCGG ATCCGCGCGC TGCTCGACGT CGACGACAGC 
CTGCCCGCCG CGGGGCAGGG CGCGCTCGGC ATCGAGATCG CCGCGCGCCG CGCCGATGTC 
GCCGCGTGGC TCGCGCCGCT GCATGATCAT GCGAGCGCGC TCGCGGTCGA GGCCGAACGC 
GCGGTGTCGC GCGCGCTCGG CGGCAGTTGC GAGGTGCCGC TCGCCGCGCA CGCGGTGTGG 
CGCGGCGGCG AGCTGCATCT GACGGGCAGC GTGTCGACGA CGGACGGCGC GCGCGTGCTC 
GCCGCGCATG CGCACGCACG CGCGGCGACG GCCGCCGATG CGCTCGCGCT CGGCCGCAGG 
GTGTCCGACG CGCTCGAGCG GCAAGGCGCG CGCGCGATCG TCGACGCGCT CGTCGCGGCG 
AGCGCGCAAG CGCAAAAGGG CGGCGCGTGA

Protein sequence

MNSETLPAEL PATLTIASRE SRLAMWQAEH VRDALRKLYP ACDVKILGMT TRGDQILDRT 
LSKVGGKGLF VKELESALAD GRADLAVHSL KDVPMALPEG FALAAVMSRE DPRDAFVSND 
YASLDALPAG AVVGTSSLRR EAMLRARHPR LDVRPLRGNL DTRLAKLDRG DYAAIILAAA 
GLKRLGLAAR IRALLDVDDS LPAAGQGALG IEIAARRADV AAWLAPLHDH ASALAVEAER 
AVSRALGGSC EVPLAAHAVW RGGELHLTGS VSTTDGARVL AAHAHARAAT AADALALGRR 
VSDALERQGA RAIVDALVAA SAQAQKGGA