Gene BURPS1106A_A1805 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1805
Symbol
ID	4905495
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1777106
End bp	1778728
Gene Length	1623 bp
Protein Length	540 aa
Translation table	11
GC content	74%
IMG OID	640144911
Product	di-haem cytochrome c peroxidase
Protein accession	YP_001075839
Protein GI	126456552
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.231553
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGGGCG GCAAGCGAAG CGGCGCGGCA CGGCGCGCGG GGGCGGCGTT CGCCGCGCGC 
GGGCCCGCCC TCGCGGGCGC GCCCGGCGCG AGGAATGCAC GCCGCATCGT TTCGACCCTC 
GCCATCGCGG CCGTCACGCG GGCGGCCGGC GGCGCGCTCG CCGCGTGCGC ATCGGCGATC 
GCCTTCGCGT CCGGCGCCGC CGCGCCGGGC GCGCTCGACG CAGTGCGCGC GGCACACCCG 
GCGAGTTCGC TGAGCCCGGC GCGCACGCCG GGCGCCGGCG GCGCGGCCCA TGTGAAGCCC 
GTGCAGGAAG CGCTCCGGGC AAAGGCCGCC TCGCCTTCGC CCTCGCTTTT GCCTTCCCCC 
CCGTCGCCGA CGACGTCCCT GCTTCCCGGC GCGCCGCCGC AGCGCGTCGT CGCCACGATC 
GGCCGAGGCA CGCCGCAGGT CGCGTCGAAA GTCGACCCGA CCGCGGCCGC GTTCCATCCG 
GACCCGGCGC TCGCCGCCCT CGGCAAGCGC GTGTTCTTCG ATCCGGCGTT ATCGGAGCCG 
CGCGGCACGT CGTGCGCGAG CTGCCACGAT CCGGGCCGCG CATTCGCGCC GACGCTCTCG 
CGCGCGGCGC TCGCCGGCCC GCGCGTGCCG CAGGGCAGCC GCCCCGGGCA TTTCAGCCGC 
CGCAACGCGC CGTCGCTGCT GTACGTGCGC TACGTGCCGC GCCGCCATTT CTATCAGGAC 
GACGACGCGC TCGCCCCCGC CCCGTTCGGC GGCTTGTTCT CGGACGGCCG CGCCGACACG 
CTCGCCGAGC AGTTGCGCGG CCCGCTCTTC GATCCGGACG AGATGAACAA CGCGTCGCCC 
GCGGCGCTCA CCCGCAAGAT CGGCGGCACC GCACTCGGCG CGGCGCTCGC CGAACGCTTC 
GGCCCGTCGG TGCGCCGCGA TCCCGAACGC ATGGTGCGCG CGCTCGGCGA AGCGATGCAG 
GCGTACCTGC AAAGCGACGA GATGGCGCCG TTCTCGTCGC GCTACGACGC GTACGTGATG 
CGACGCGCGC CGCTCACGCC GCAGGAGAGG CGCGGGCTCG CGCTCTTCAG GAATCCGGAC 
AAAGGCAACT GCATGAGTTG CCACACGCTG TCGGACACCG CGAGCCGGCC CGAGCGCTCG 
CTCTTCACCG ACTTCGGCTA CGACGCGATC GCGGTGCCGC GCAATCGCGC GCTGCGTGCG 
AACCGCGACC CGCGCCACTT CGACAACGGC CTGTGCGACA CCGCCGCGAA GCTGCGCTGG 
CCCGAGCCGG CGCAATGGTG CGGCTATCTG CGCACGCCCG GCCTGCGCAA CGTCGCGATC 
AAGGAGTCGT TCATGCACAA CGGCGTGTTC GACACGCTGC GCGATGCGGT GGCGTTCTAC 
AACACGCGCT CGACGGATCC GAAGCGCTGG TATCACGGCC GCGATACGTT CGACGACGTG 
CCGGCCGCGT ACCGCGGCAA CATCAACGTG AACTCGACGC CGATGAACCG CCGAGCCGGC 
ACGCCACCCG CGATGACGGA CGCCGACGTC GACGACATCG TCGCGTTCCT GCGCACGCTG 
ACGGACGCCC GCTACGTCGG GCTGATGCCC GCGGCGCCCG ACGGCAAGGC GGCGCGACCG 
TGA

Protein sequence

MTGGKRSGAA RRAGAAFAAR GPALAGAPGA RNARRIVSTL AIAAVTRAAG GALAACASAI 
AFASGAAAPG ALDAVRAAHP ASSLSPARTP GAGGAAHVKP VQEALRAKAA SPSPSLLPSP 
PSPTTSLLPG APPQRVVATI GRGTPQVASK VDPTAAAFHP DPALAALGKR VFFDPALSEP 
RGTSCASCHD PGRAFAPTLS RAALAGPRVP QGSRPGHFSR RNAPSLLYVR YVPRRHFYQD 
DDALAPAPFG GLFSDGRADT LAEQLRGPLF DPDEMNNASP AALTRKIGGT ALGAALAERF 
GPSVRRDPER MVRALGEAMQ AYLQSDEMAP FSSRYDAYVM RRAPLTPQER RGLALFRNPD 
KGNCMSCHTL SDTASRPERS LFTDFGYDAI AVPRNRALRA NRDPRHFDNG LCDTAAKLRW 
PEPAQWCGYL RTPGLRNVAI KESFMHNGVF DTLRDAVAFY NTRSTDPKRW YHGRDTFDDV 
PAAYRGNINV NSTPMNRRAG TPPAMTDADV DDIVAFLRTL TDARYVGLMP AAPDGKAARP