Gene BURPS1106A_A0550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0550
Symbol
ID	4905976
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	527278
End bp	528648
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	71%
IMG OID	640143656
Product	di-haem cytochrome c peroxidase
Protein accession	YP_001074586
Protein GI	126456121
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.77127
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTCGCGCG CCGGCCGCGC GCGCCGTGTC ACCGCCCTTG CTCTCGCACT CGCGGCGCTT 
GCCGGTGCCG CCTCGCTCGC GGTATGTGCC GCGCCCGCTA GCACCACCAT GCTGCTGCCC 
GGCGCGCCGC CCGCGCGTGT GGTCGATACG ATCGGCAACG GCACGCCGCA GGTCTCGTCC 
AAGATCGATG CGTCCGCCGC GCGCTTCGTG CCGGACCCCA CGCTCGTCGC GCTCGGACGC 
CGCATCTTCT TCGACACGCG CCTGTCCGAG CCGCGGGGGA TGTCGTGCGC CGGCTGCCAC 
GATCCCGGCC GCGCGTTTGC GCCGACGCTG TCCGCGGCCG CGCTCGCGGG CCCCGGCGTG 
CCGGAAGGCA GCCGGCCGGG ACGCTTCAGC CGGCGCAACG CGCCGTCGCT GCTCTACGTG 
CGCTACGTGC CGCGCCGCCA CTTCTACCAG GATGACGACG CGCCCGCACC GTCGCCGTTC 
GGCGGCCTGT TCAGCGATGG CCGCGCGGAC ACACTCGCCG AGCAGATCCG CGGGCCGCTG 
TTCGACCCGA ACGAGATGAA CAACCGGTCG CCCGCCGCGC TGCTGCGCAA GGTCGACGCG 
ACCGAACTCG CACCGGCGCT CGCCGCGCGC TTCGGCGACG GCGTGCGGCT CGACCCCGCA 
CAGCTCGTGC GCGCGCTCGG CGCTTCGGTC GAGGCGTACC TGCAGAGCGA CGAGATGGCG 
CCGTTCACAT CGCGCTTCGA CGCGTACCTG CGCCAGCGCA CGCCGCTTGA CGCACAGCAG 
ATGCGCGGCC TCGCGCTGTT CAAGAATCCC GACAAAGGCA ACTGCATGAG CTGCCACACG 
TTGTCGGATA CGTCGAGCCG CCCGGAACGG TCGCTGTTCA CCGATTTCGG TTACGACGCG 
ATCGCCGTGC CGCGCAACCG CGCGCTGCCG GCCAATCGCG ACCCGCGCCA TTTCGACAAC 
GGGCTGTGCG ACACCGCGCG CCGGCTGCGC TGGCCCGAAC CCGGCCAGTG GTGCGGCTAC 
CTGCGCACGC CGAGCCTGCG CAACGTCGCG CTCAAGCAGA CCTTCATGCA CAACGGCGTG 
TTCACGTCGC TGCGCGACGC GGTGGCGTTC TACAACACGC GCTCGACCGA TCCACGCCAC 
TGGTATCACG GCGCCGCGAC GTTCGACGAC GTGCCGCCCG CGTACCGCGG CAACATCAAC 
GTCAACTCGA CGCCGATGAA TCGCCGCCCC GGCACGCCGC CCGCGCTGAC CGAAGCGGAA 
ATCGACGACC TCGTCGCGTT CCTCGGCACG CTGACCGACG CACGCTATGC CGCCGGCGCC 
CCCCCTCATT TAAAGATTCA TGATTCGCAA GCCTTTACGA TTGCCCCATA A

Protein sequence

MSRAGRARRV TALALALAAL AGAASLAVCA APASTTMLLP GAPPARVVDT IGNGTPQVSS 
KIDASAARFV PDPTLVALGR RIFFDTRLSE PRGMSCAGCH DPGRAFAPTL SAAALAGPGV 
PEGSRPGRFS RRNAPSLLYV RYVPRRHFYQ DDDAPAPSPF GGLFSDGRAD TLAEQIRGPL 
FDPNEMNNRS PAALLRKVDA TELAPALAAR FGDGVRLDPA QLVRALGASV EAYLQSDEMA 
PFTSRFDAYL RQRTPLDAQQ MRGLALFKNP DKGNCMSCHT LSDTSSRPER SLFTDFGYDA 
IAVPRNRALP ANRDPRHFDN GLCDTARRLR WPEPGQWCGY LRTPSLRNVA LKQTFMHNGV 
FTSLRDAVAF YNTRSTDPRH WYHGAATFDD VPPAYRGNIN VNSTPMNRRP GTPPALTEAE 
IDDLVAFLGT LTDARYAAGA PPHLKIHDSQ AFTIAP