Gene BURPS668_3222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3222
Symbol
ID	4883216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	3152158
End bp	3153360
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	71%
IMG OID	640129150
Product	polysaccharide biosynthesis/export protein
Protein accession	YP_001060233
Protein GI	126441359
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTAGTC TGGGGGAAGC AGGCGGCATC GCGCCGCCGA AACGCACGTG CGGCGCGCGC 
GTGCGTCGGC TGATGAAGCG GGTGACGCTG TGCGCGGCGC TTGCGGCATT GAGCGCGTGC 
GGCGTCGCGC CCGGCATGCG GATGAAACAG CCGGCGAACG TGCCGGTGTC GAGCGCGGCA 
GCGGACGCGC CGGCCGAGGC CGGACGCAAG CCGCGCGGCG AGCAGCTGCC GGTGCCGATC 
ACCGACATCG ATCTGAGCCT GATCCGGACG CTGCGCGATG CGCAACAGGC GCCGCGCCGC 
GCGGCCGATC TCGTATCGCC GGCGTCGGGC TATACGATCG GGCGCGGCGA CGTGCTGCAG 
ATCACGGTCT GGGACCACCC CGAGCTCGCG GCGGCGCTCG GCACGCAGCA GCAGACGGCG 
GCGCGCGCGG CCGATGCGCC GGCGGGCTTC GTCGTCGATC AGGACGGCAC GCTCCAGTAC 
CCGTACGTCG GGCGCATCGC GGTGGCGGGC CTGAAGCCGG AACAGGTTCA GGCGCGGCTC 
GCGCGCCAGC TCGCGCAGAC GTTCCGCGAT CCGCAGGTGA CGGTGCGCAT CGCATCGTTT 
CGCGCGAAGC AGGTCTACAT CGAAGGCGAG GTGCATACGC CCGGTTCGCA GGCGCTCAAC 
GACATCCCGA TGACGCTGTA CGACGCGGTG AGCCGCGCGG GCGGCTTCTC GGCGAGCGCG 
GACCAGCGGC GCGTGACGCT CGTGCGCGAC GGCGTCGAAC GAAGGATCGA TCTGTCGGGC 
GCTGCACAGG GCGTCAATCC GTCACGGATC GTGCTGCGCG ACGGCGATTT GCTGCGCATT 
CCGCCGCGCG ACGAAAGCGG CGTGTTCGTG ATGGGCGAGG TCAACCGGCC CGTCACCGCG 
CTGCCGATGC GCAACGGCCG CCTGACGCTG AGCGAGGCGC TGTCGCAGGC CGGCAGCCTG 
AACGCGACGA CGGCCGACGC CGCGCAACTG TATGTGATTC GCGGCTCGCT CGACGCGAAG 
CCGCACGTGT ATCGGCTCGA CGCGAGCTCG CCCGTCGCGA TGGTGCTCGC GAACCAGTTC 
GAGCTGGAGC CGAAGGACAT CGTCTATGTC GACGGCAACG GCCTCGTGCG CTTCAGCCGC 
GTGCTCAGCC TGTTGCTGCC GGCCGTCAAC GCCGGCCTGA CCGCGGCGGT CGTGACCAAA 
TGA

Protein sequence

MGSLGEAGGI APPKRTCGAR VRRLMKRVTL CAALAALSAC GVAPGMRMKQ PANVPVSSAA 
ADAPAEAGRK PRGEQLPVPI TDIDLSLIRT LRDAQQAPRR AADLVSPASG YTIGRGDVLQ 
ITVWDHPELA AALGTQQQTA ARAADAPAGF VVDQDGTLQY PYVGRIAVAG LKPEQVQARL 
ARQLAQTFRD PQVTVRIASF RAKQVYIEGE VHTPGSQALN DIPMTLYDAV SRAGGFSASA 
DQRRVTLVRD GVERRIDLSG AAQGVNPSRI VLRDGDLLRI PPRDESGVFV MGEVNRPVTA 
LPMRNGRLTL SEALSQAGSL NATTADAAQL YVIRGSLDAK PHVYRLDASS PVAMVLANQF 
ELEPKDIVYV DGNGLVRFSR VLSLLLPAVN AGLTAAVVTK