Gene BURPS668_1071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1071
Symbol	hemC
ID	4883458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1049698
End bp	1050687
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	73%
IMG OID	640126999
Product	porphobilinogen deaminase
Protein accession	YP_001058121
Protein GI	126439305
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0181] Porphobilinogen deaminase
TIGRFAM ID	[TIGR00212] porphobilinogen deaminase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTCCG AGACTCTTCC GGCCGAGCTG CCCGCGACGC TGACGATCGC GTCGCGCGAG 
AGCCGCCTCG CCATGTGGCA AGCCGAGCAT GTGCGTGATG CGCTGCGCAA ATTATATCCA 
GCTTGTGACG TGAAAATCCT CGGGATGACG ACGCGCGGCG ATCAAATTCT CGATCGCACG 
CTATCGAAGG TCGGCGGCAA GGGTCTGTTC GTCAAGGAGC TCGAGAGCGC GCTTGCCGAC 
GGCCGCGCGG ATCTCGCCGT GCATTCGCTG AAGGACGTGC CGATGGTGCT GCCCGAAGGC 
TTCGCGCTCG CGGCGGTGAT GAGCCGCGAG GATCCGCGCG ACGCGTTCGT GTCGAACGAT 
TACGCGTCGC TCGACGCGCT GCCGGCGGGC GCCGTCGTCG GCACGTCGAG CCTGCGCCGC 
GAGGCGATGC TGCGCGCGCG CCATCCGCGG CTCGACGTGC GGCCGCTGCG CGGCAATCTC 
GACACGCGGC TCGCGAAGCT CGACCGCGGC GATTACGCGG CGATCATCCT CGCCGCCGCG 
GGCCTCAAGC GTCTCGGCCT CGCCGCGCGG ATCCGCGCGC TGCTCGACGT CGACGACAGC 
CTGCCCGCCG CGGGGCAGGG CGCGCTCGGC ATCGAGATCG CCGCGCGCCG CGCCGATGTC 
GCCGCGTGGC TCGCGCCGCT GCACGATCAT GCGAGCGCGC TCGCGGTCGA GGCCGAACGC 
GCGGTGTCGC GCGCGCTCGG CGGCAGTTGC GAGGTGCCGC TCGCCGCGCA CGCGGTGTGG 
CGCGGCGGCG AGCTGCATCT GACGGGCAGC GTGTCGACGA CGGACGGCGC GCGCGTGCTC 
GCCGCGCATG CGCACGCACG CGCGGCGACG GCCGCCGATG CGCTCGCGCT CGGCCGCAGG 
GTGTCCGACG CGCTCGAGCG GCAAGGCGCG CGCGCGATCG TCGACGCGCT CGTCGCGGCG 
AGCGCGCAAG CGCAAAAGGG CGGCGCGTGA

Protein sequence

MNSETLPAEL PATLTIASRE SRLAMWQAEH VRDALRKLYP ACDVKILGMT TRGDQILDRT 
LSKVGGKGLF VKELESALAD GRADLAVHSL KDVPMVLPEG FALAAVMSRE DPRDAFVSND 
YASLDALPAG AVVGTSSLRR EAMLRARHPR LDVRPLRGNL DTRLAKLDRG DYAAIILAAA 
GLKRLGLAAR IRALLDVDDS LPAAGQGALG IEIAARRADV AAWLAPLHDH ASALAVEAER 
AVSRALGGSC EVPLAAHAVW RGGELHLTGS VSTTDGARVL AAHAHARAAT AADALALGRR 
VSDALERQGA RAIVDALVAA SAQAQKGGA