Gene BURPS668_1702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1702
Symbol
ID	4885322
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	1676401
End bp	1677501
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	72%
IMG OID	640127630
Product	polysaccharide deacetylase family protein
Protein accession	YP_001058743
Protein GI	126440931
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACCA ACATGTCCGA CGCGGCCGGC GCACCGGCCG CTTCATTCGC GCCCGAGCGG 
CGCGCGTTCC TGGCCCGTGC GGGCGGCGGG CTCGGCCTCG CGGCGGCCGG GCTCGCGCTC 
GGCGCGGCAG CGGCGCCGGG CCGGGCGCTC GCGGCCGGCG CCACGGCCAC CGCCGATACC 
GGCGCGGCGT CACCCGCCGG CGGCTCGCCG CGGCGCTCCC CCGCCGACGA GCCCGAGGCG 
GCGCACGGCG CGTTCTGGCC GAACGGCGCG CGGCTCGTGA TCTCGATCTC GATGCAGTTC 
GAGGCGGGCG GCCAGCCGCC GACGGGCGCC GACAGCCCGT TCCCGCCCGT CGACTTTCCG 
CCGCAGGTGC CCGTCGATCT CGCGTCCGCG ACGTGGTTCG CCTACGGCTA TCGCGAAGGC 
ATCCCGCGCA TGCTCGATTT GTGGGACCGG CACGGCGTGA AGGTCACCTC GCACATGATC 
GGCGAGGCCG TGCGCCGCCG GCCGGATCTC GCCCGAGAGA TCGTCGCGCG CGGCCACGAG 
GCGGCCGGAC ACGGGCCGCG CTGGAGCGCG CAGTACGCAC TCCCCCGCGA CGAAGAGCGG 
CGCTTCCTGA TCGCCGCCCG CGAGATGGTC GAAACCGCGA CGGGCGCGCG GCCCGTCGGC 
TACAACTGCA ACTGGCTCAG ACGCGGGCCG AACACACTGC CGCTGCTGCA GGAGCTCGGC 
TATCTGTACC ACATCGACGA CGTGAGCCGC GACGAGCCGT TCATCGAGCA GGTGAACGGC 
CAGGATTTCG TCGTCGTGCC CTACACGCTG CGCAACAACG ACATCCTGCT GATCGAAGGT 
CGCAACTATT CGCCCGGGCA ATTCCTCGAG CAGATCAAGC TCGACTTCGA TCAGTTGTAC 
GACGAAGCCG CCACGCGGCG GCGCATGATG TCGATCAGCG CGCACGACCG GATCAGCGGC 
ACGCCGCAGA TGGTGCGCGC GTGGGACGCG TTCCTGCGCT ACGCGCAATC GCATCCGGGC 
GTCGCGTTCA TGCGCAAGGA CGACATCGCC CGCCATGCAC TGCGTAGCCC GCTCACGCTG 
CGCGAACCCG AAACCCTCTG A

Protein sequence

MTTNMSDAAG APAASFAPER RAFLARAGGG LGLAAAGLAL GAAAAPGRAL AAGATATADT 
GAASPAGGSP RRSPADEPEA AHGAFWPNGA RLVISISMQF EAGGQPPTGA DSPFPPVDFP 
PQVPVDLASA TWFAYGYREG IPRMLDLWDR HGVKVTSHMI GEAVRRRPDL AREIVARGHE 
AAGHGPRWSA QYALPRDEER RFLIAAREMV ETATGARPVG YNCNWLRRGP NTLPLLQELG 
YLYHIDDVSR DEPFIEQVNG QDFVVVPYTL RNNDILLIEG RNYSPGQFLE QIKLDFDQLY 
DEAATRRRMM SISAHDRISG TPQMVRAWDA FLRYAQSHPG VAFMRKDDIA RHALRSPLTL 
REPETL