Gene BURPS668_0771 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0771
Symbol
ID	4884028
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	750989
End bp	752134
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	75%
IMG OID	640126699
Product	cytochrome c oxidase, subunit II
Protein accession	YP_001057823
Protein GI	126438974
COG category	[C] Energy production and conversion
COG ID	[COG1622] Heme/copper-type cytochrome/quinol oxidases, subunit 2
TIGRFAM ID	[TIGR02866] cytochrome c oxidase, subunit II

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0315373
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGGCG CAAACATGTC GGTGAAGCCC GCACAGCGGC CCGAGCGCGG GTTCGCGAAG 
ACGCGGCGGC GCACCGCCGC GTATCGCCCC GCCGCGACGC GCGCGGCGGG CGTCGCGCGC 
GTCGCGCGCG CGGCGGGCGC GGCGACACCG TCACTCGCCG CCGCGCTGCA CGCCGCCGCC 
GCGCACGCGC AAGCGCACGC CGCCCAGCCC GCCGTGCTGC CGCTCGCGTA CGTGTTCGAC 
AGTGCGGGCC CCGCCGCGCG GCCCGTGCTG ATCCTCGGCT GGGCGCTGCT CGCGCTGTGC 
ACCTCGGTCT GCGTCGTGAT CGCGGTCCTG CTCGCACTCG CGTTGTTCAG GCGGCGCGCC 
GCGACGGCCG GCCTCACCGA GCGCGGCGGG CTCGGCTTCG TCTACGTCGG CACCGCGATC 
TCGACCGCGC TGCTGCTCGC CGCGCTCGTC TACATGCTGT GGGTGCTCGC CGCGGTCGCG 
AAGCCGCCGC GCCCGCCCGC GGTGACGATC GCGGTCACGG CGTACGACTG GTGGTGGAAG 
GCCGACTACG GCGGCGGCCC GCCCGACGGC TTCACGACCG CGAACGAACT GCACGTGCCC 
GTCGGCGAAC CGGTGCTGAT CGAGCTGCGC AGCGCCGACG TGATTCATGC GTTCTGGGCG 
CCGCAACTCG CGGGCAAGAC GCAGGCGATT CCCGGCCAGA TCAATCGTCA ATGGATGCAG 
GCGGACCGGC CGGGCGTCTA TCGCGGGCAG TGCACGCAGT TCTGCGGCGC GCAGCACGCG 
CAGATGGGCT TCGAAATCGT CGCCGAACCG CCCGACGCGT ACCGGCGCTG GTACGCGTCG 
CAGCGGCGCG GCGCCGAAGC GCCGCGCACG GCCGACGCGC TGCGCGGCCA GCGAATCTTC 
GCCGATCGCT GCGCGGGCTG CCACGCGGTG CGCGGCACCG GCGCGGCGGG CACGCAGGCG 
CCCGATCTCA CGCATGTCGG CGCGCGCCGC CTGCTCGCGG CGGGCGCGCT CGCGAACACG 
CCGGACGAGC TGCGCCGCTG GATCGCCGAT GCGCAGCAGG TGAAGCCACA GTCACTGATG 
CCGTCGATCC GGCTCGACCC CGCGCAGCAG CGCGACCTGT CCGCGTATCT GGCAACGCTG 
CGATGA

Protein sequence

MNGANMSVKP AQRPERGFAK TRRRTAAYRP AATRAAGVAR VARAAGAATP SLAAALHAAA 
AHAQAHAAQP AVLPLAYVFD SAGPAARPVL ILGWALLALC TSVCVVIAVL LALALFRRRA 
ATAGLTERGG LGFVYVGTAI STALLLAALV YMLWVLAAVA KPPRPPAVTI AVTAYDWWWK 
ADYGGGPPDG FTTANELHVP VGEPVLIELR SADVIHAFWA PQLAGKTQAI PGQINRQWMQ 
ADRPGVYRGQ CTQFCGAQHA QMGFEIVAEP PDAYRRWYAS QRRGAEAPRT ADALRGQRIF 
ADRCAGCHAV RGTGAAGTQA PDLTHVGARR LLAAGALANT PDELRRWIAD AQQVKPQSLM 
PSIRLDPAQQ RDLSAYLATL R