Gene BURPS1710b_A0915 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A0915
Symbol	wza
ID	3692021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	-
Start bp	1175143
End bp	1176333
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	66%
IMG OID	637731169
Product	capsular polysaccharide biosynthesis/export periplasmic protein
Protein accession	YP_336073
Protein GI	76818460
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.138032
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGCAA AAGATATGCT GAATCGTTCG CTTAGACCCC TGGCGCTCGC CGTCGCCGCC 
GCCACGCTGC TGCAGGCGTG CGCGACGGCG CCCGGCAACT ACCTCGACAC GTCGCGTCTC 
GACGACAAGG ACAGCCAGTC CGCCGAGCAT TACAACGTGC AGCTCATTAC CGCGCAGCTC 
GTCGTTTCGC AGGCCGACGC GCAGCGCAAG GCTGGGCCGT TGCCGCCGGC GCGCTTCGTC 
GATCCGATGC AGTACGTCTA CCGGATCGCG CCGCAGGACA TTCTCGGCGT GACCGTCTGG 
GATCATCCGG AGCTCACGAC GCCGCAAGGC CAATCGTTCT CGAGCGGCGG CAACACGACG 
CAGACGGTCG CGGGCGCGCT GCAGCAGCCG TATGCGAATG CGTTGCCCGG CCAGGCCGAT 
CCGTACGGCC AGACGGTGAT GTCCGACGGC ACGATCTACT TTCCGTTCGT CGGCCGCCTG 
CACGCGGCGG GCAAGACGGT CGGCCAGGTG CGCGACGAAC TCGCCGCGCG GCTGGCGCGT 
TACGTGAAGA ATCCGCAGGT CGACGTGCGC GTGCTGTCGT ATCGCAGCCA GAAGGTGCAG 
GTGACCGGCG AAGTGAAGAC GCCCGGCCCG CTTGCGATCA CCGATGTGCC GCTCACGCTC 
GTGGACGCGA TCACGCGCTC GGGCGGCTCG ACGAACGAGG CCGACCTGCA GCGCGTGCGC 
CTCACGCGCG ACGGCAAGTT CTACCAACTC GACGCGAACG GCATGCTCGA TCGCGGCGAC 
GTCACGCAGA ACGTGATGCT GCAGCCGGGC GACATCGTCA ACGTGCCGGA CCGCGGCGAC 
AGCCGCGTGT TCGTGATGGG CGAGGTGAAG ACGCCCGCGA CGGTGCCGAT GCTCAAGGGG 
CGCTTGACGA TCGCGGACGC GCTCACGGCG GGAGGCGGCA TTCTCGATAC CGATGCGAAT 
CCGCGTCAGG TGTACGTGTT GCGCGATCTG CAGGACAAGC CGAACACACC GGACATCTTC 
CGCCTCGACA TGACGCAGCC CGACGCGCTG ATGCTGTCGA GCCGCTTCCA GTTGAAGCCG 
CTCGACGTCG TGTACGTCGG CACGGCGGGA TCGGTGCGCT TCAACCGCCT GCTGCAGCAG 
ATCTTCCCGA CGATCCAGTC GATTTACTAC ATGAAGCAGA TCACGCGCTG A

Protein sequence

MAAKDMLNRS LRPLALAVAA ATLLQACATA PGNYLDTSRL DDKDSQSAEH YNVQLITAQL 
VVSQADAQRK AGPLPPARFV DPMQYVYRIA PQDILGVTVW DHPELTTPQG QSFSSGGNTT 
QTVAGALQQP YANALPGQAD PYGQTVMSDG TIYFPFVGRL HAAGKTVGQV RDELAARLAR 
YVKNPQVDVR VLSYRSQKVQ VTGEVKTPGP LAITDVPLTL VDAITRSGGS TNEADLQRVR 
LTRDGKFYQL DANGMLDRGD VTQNVMLQPG DIVNVPDRGD SRVFVMGEVK TPATVPMLKG 
RLTIADALTA GGGILDTDAN PRQVYVLRDL QDKPNTPDIF RLDMTQPDAL MLSSRFQLKP 
LDVVYVGTAG SVRFNRLLQQ IFPTIQSIYY MKQITR