Gene BURPS1710b_1805 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_1805
Symbol
ID	3691460
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	1968251
End bp	1969654
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	72%
IMG OID	637728261
Product	di-haem cytochrome c peroxidase
Protein accession	YP_333206
Protein GI	76812115
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCGCT TGCCGCGATA CGCCCGCCAG CACCGTTCGT TCTTCGTCGC GCCGCGCGCG 
TTCGCGGCGG CCGCCGCGCT TGCCGCGGGC GTCGCCGCGT GTGACGCGAA CGGGCCGGGC 
GCGAGCGCCG CCGCGGCCGT CGCGCCCGCT GCGCTCGCTG TCCCAGCCGC CTCCGCTGCC 
TCCGCTGCGC GTCCCGCGCC GCTCGCGCAG CCGGCCGCGC CCGCCGTCGT CGACAGTCAG 
CCGCAGACGC GCGCGCAGGT GTACGAGGCG GTCAAGCAGA TGACGGCGCT CGGCAGGCAG 
TTGTTCTTCG ATCCTTCGCT GTCGGGCAGC GGCAAGCTCG CCTGCGCGTC GTGCCACAGC 
CCGCAGCACG CGTTCGGGCC GCCGAACGCG CTGCCCGCGC AATTCGGCGG CGACGATCTG 
CGCCAGCAGG GCTTTCGCGC CGTGCCGACG CTCAAATACC TGCAGAAGGT GCCCGCGTTC 
AGCGAGCACT ATCACGAATC GGACGACGAG GGCGACGAGA GCGTCGACGC CGGCCCGACG 
GGCGGGCTCA CGTGGGACGG CCGCGTGGAC AGCGGCGCCG AGCAGGCGCG CGCGCCGCTC 
ACGTCGCCGT TCGAGATGAA CGGCACGCCC GAGAAGGTCG CGCGCGCGGT GCGGGCCGCG 
CCGTACGCGC CCGCGTTTCG CGCGGCGTTC GGCGCGCGCG TGCTCGACGA CGACCGCGCG 
ACGTTCGAGG CGGTGCTGCA GGCGCTCGGC ACGTTCGAGC AGGCGCCCGA CGTGTTCTAT 
CCGTACACGA GCAAGTACGA CGCGTACCTG GCGGGCCGCG CGCGGTTGAC GCGCGCCGAG 
CTGCACGGGC TGCAGGTCTT CAACGACGAG AAGAAGGGCA ACTGCGCGAG CTGCCACGTG 
AGCCGGCGCG GGCTCGACGG CTCGCCGCCG CAGTTCAGCG ATTTCGGCCT GATCGCGCTC 
GGCGTGCCGC GCAATCGCGC GCTCGCGGTG AATCGGAATC CGAATTTTTA CGACCTCGGC 
GCATGCGGGC CCGAGCGCCG GGACCTGAAG GGGCGCGACG AGTTCTGCGG GCTGTTCCGC 
ACGCCGACGC TGCGTAACGT CGCGCTGAAG AAGACGTTCT TCCACAACGG CGTCTATCAC 
TCGCTCGACG ACGTGCTGCG CTTCTACGCC GAGCGCGACA CGCATCCGGA GAAGTTCTAT 
CCGGTGAAGC GCGGCGTCGT TCAGAAGTTC GACGACTTGC CGAAGCGCTA CTGGAAGAAC 
CTGAACGACG AGCCGCCGTT CGAGCGCAAG CGCGGCGATC CGCCCGCGAT GACCGATGCG 
GAGATCCGGG ACGTGATCGC GTTCCTCGGC ACGCTCACCG ACGGCTACGA TCCGCGCGCG 
AAGCCGGCAG GCGGCGCGCG CTGA

Protein sequence

MRRLPRYARQ HRSFFVAPRA FAAAAALAAG VAACDANGPG ASAAAAVAPA ALAVPAASAA 
SAARPAPLAQ PAAPAVVDSQ PQTRAQVYEA VKQMTALGRQ LFFDPSLSGS GKLACASCHS 
PQHAFGPPNA LPAQFGGDDL RQQGFRAVPT LKYLQKVPAF SEHYHESDDE GDESVDAGPT 
GGLTWDGRVD SGAEQARAPL TSPFEMNGTP EKVARAVRAA PYAPAFRAAF GARVLDDDRA 
TFEAVLQALG TFEQAPDVFY PYTSKYDAYL AGRARLTRAE LHGLQVFNDE KKGNCASCHV 
SRRGLDGSPP QFSDFGLIAL GVPRNRALAV NRNPNFYDLG ACGPERRDLK GRDEFCGLFR 
TPTLRNVALK KTFFHNGVYH SLDDVLRFYA ERDTHPEKFY PVKRGVVQKF DDLPKRYWKN 
LNDEPPFERK RGDPPAMTDA EIRDVIAFLG TLTDGYDPRA KPAGGAR