Gene BURPS1106A_A1042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1042
Symbol
ID	4906091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	1008763
End bp	1010373
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	71%
IMG OID	640144148
Product	di-haem cytochrome c peroxidase family protein
Protein accession	YP_001075078
Protein GI	126457905
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.023459
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCCGCG CACGCTCGGC GCGGCGCCGC CCGCACGCGA CGCGCGCCCG ATACATCACC 
GATGCACGGC CGGCCGGCGC ACGCAACGCC GGCCGTCATT CCGGCGCGAC GCACGCCGGA 
TTTTTCTTTT GCATGATCAC GACCGAACGC TCCAGCATGG CCGAACCGCT TTGCGCGCAA 
CCCGCTCCGT CCACCCGATC CGACGCATGC GCGCCGGCCG CGCTTGCCAC CGTCTCGCGC 
CGCCGCGGCC GCCGCAACGC GCGCGCGATG CGCCACGCGC CGGCGGCCGC CGCGTTCGGC 
GTGCTCGGCT TCGCCGCGTT CGCGCTGGCG TTTCCCGAGC ATGTGCCGAA CGCGGTCGGC 
GCGATCGTCG AAAACCTCAC GGGCGCGAAT CCGCAGCCGG TCGCGCTGCG CCGCCCGGGC 
GCCGAGCCGC TGAGCGCGGT CGCGCAGCTC GGCCGCGCGC TGTTCTTCGA TCCCGCGCTG 
TCCGCGTCGG GCCGGCAATC GTGTGCGTCG TGCCACAGCC CCGATCATGC GTACGGCCCG 
CCGAACGATC TGGACGTGCA ACTGGGCGGC GCCGCGCTGA CGCAGCCCGG CTATCGGCCG 
CCGCCGTCGC TGATGTATCT GTACCGGCAG CCGAACTTCA GCATCGGCCC GGACTCGTCC 
GAGAACGACG ACGCGGCGAG CGTCGCGCAA CAGGCCGCAT CCGCGGCGGG CGCCGTGCGC 
GCGCGGAAGA GCGCCGGCGC GGCGGCCGCG CCGCAGCTCG TGCCGCAGGG CGGGATGTTC 
TGGGACGGCC GCGCGGATAC GCTGCAGCAG CAGGCGTTCG GCCCGTTGAT GAATCCGGTC 
GAGATGGCGA ACGCGAGCAC CGGCGACGTC GCGCGCAAGC TCGCGCACGC GCGCTACGCG 
CCGCGGTTCC GGCAGTTGTT CGGCCCGCGC ATCTTCGACG ACGCACGTCT TGCGGTGTCC 
GAAGCGATGT TCGCGATCGC GCGCTACCAG GTGGAGGACC CGTCGTTCCA TCCGTATTCG 
AGCAAGTACG ACCGCTGGCT CGAAGGCGAC GCGCGGCTCA CGCAGGCGGA GCTGCGCGGC 
ATGCGGCGCT TCAACGATCC GAACAAGGCG AATTGCGCGG GCTGCCACCT GTCGAAGCCG 
AGCGCGGACG GTCTGCCGCC GATGTTCACC GATTTCCAGT ACGAGGCGCT CGGCGTGCCG 
CGCAACCGCG CGCTCGCGCA GAACCGCAAT CCGGCGTTCC ACGATCTCGG CATCTGCGGG 
CCGTTTCGCG ACGACTTGAA GACGCAGACG CAATACTGCG CGATGTTCGC GACGCCTTCG 
CTGCGCAACG TCGCGACGCG CCGCGTGTTC TTCCACAACG GCGTCTATCA TTCGCTCGAC 
CGGGTGCTCG CGTTCTACAA CCTGCGCAGC GTCGATCCGG GCAAGATCTA TCCGCGCGAC 
GCAAGCGGCC GGGTGCTGCA ATACGACGAC ATCCCGAGCG CGTATCGCGC GAACGTCGAC 
GTCGCCGATG CGCCGTTCGA CCGCAAGCCG GGCGACGCGC CCGCGATGAC CGAGCAGGAC 
ATGCGCGACA TCGTTGCGTT TCTGAACACG CTGACCGACG AGAAGCGCTG A

Protein sequence

MRRARSARRR PHATRARYIT DARPAGARNA GRHSGATHAG FFFCMITTER SSMAEPLCAQ 
PAPSTRSDAC APAALATVSR RRGRRNARAM RHAPAAAAFG VLGFAAFALA FPEHVPNAVG 
AIVENLTGAN PQPVALRRPG AEPLSAVAQL GRALFFDPAL SASGRQSCAS CHSPDHAYGP 
PNDLDVQLGG AALTQPGYRP PPSLMYLYRQ PNFSIGPDSS ENDDAASVAQ QAASAAGAVR 
ARKSAGAAAA PQLVPQGGMF WDGRADTLQQ QAFGPLMNPV EMANASTGDV ARKLAHARYA 
PRFRQLFGPR IFDDARLAVS EAMFAIARYQ VEDPSFHPYS SKYDRWLEGD ARLTQAELRG 
MRRFNDPNKA NCAGCHLSKP SADGLPPMFT DFQYEALGVP RNRALAQNRN PAFHDLGICG 
PFRDDLKTQT QYCAMFATPS LRNVATRRVF FHNGVYHSLD RVLAFYNLRS VDPGKIYPRD 
ASGRVLQYDD IPSAYRANVD VADAPFDRKP GDAPAMTEQD MRDIVAFLNT LTDEKR