Gene BURPS668_3238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3238
Symbol
ID	4883772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	3173324
End bp	3174526
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	59%
IMG OID	640129166
Product	capsule polysaccharide biosynthesis protein
Protein accession	YP_001060249
Protein GI	126439773
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3562] Capsule polysaccharide export protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.333462
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCGCT TCTTCCTTGC CCTGCAAGGC ACGGCCTCTC CTTTTTTTGG TCGACTCGCT 
GCCGGTCTCG GTCAGCGGGG CCACCAGGTT CGGCGTGTGA ATTTTTGCGG CGGAGATCTC 
GCGTATCAAG GTTCGGAAAG CGCTTGGAAC TATCGCGACG AACCCGAAGG CCTGGTTGCG 
TGGTATCGCG ATGCCATTGC GACCAATGGA GTGACGGATG TGCTTCTGTT TGGCGACTGC 
CGTGCGATCC ACCGGCCGAT GCATGAGATC GCTCGCGCAT CGGGGGTGCG TGTTCACGTA 
TTCGAAGAGG GGTATGTTCG ACCGCACTGG ATCACAATGG AAAGACACGG CGTCAACGGC 
CGATCGTTGC TGCCGCGCGA CCCGGCTTAC TATCTCGACG CACGCCGGCA TATCCCGCCA 
GCGGTACCCG GGAAACCGAC CGGCTACAAC CTGTACGAGC GCGCCTGCCA CGATATCAGG 
TATCGCATGG CCAACGCGTT GTACGCGCAT CGTTTCCCGC ATTACAAGTC GCACCGTCCG 
AGAAACGGCT TACAGGAGTA CGCGGGCCTC GCGTATCGCG CCGTTCAGCA ACACGTGCGC 
GATAGGGAGG CCGAGAACGT CACCCGTGAT CTGCTGGAAC GAAAACGCCG CTACTATCTG 
TTTCCGCTGC AGCTCAATTC CGACTCCCAG ATCGTCGATC ATTCCCCGTT TGGCGGCATT 
TGCGACGCGA TAGCGATTGT TTTACACTCA TTCGCCGAAA ATGCGCCCGA CGACAGTTGG 
CTTGTCATCA AGAATCATCC GTTGGACACC GGTCTGATCG GCTACCGTCA ATTTGCAACG 
GCATTGGCCA CTGAACTGGG TATCGAGAAG AGAATGGCCT TCATCGATGC GGGCCACTTG 
CCGACGTTAC TCGATCAATG TCGTGGCGTG GTCGTGATAA ACAGCACGGT CGGTTTGTCC 
GCCGTCCACC ATCGACGCCC GCTCGTTGCA TTGGGCACCG CGATCTATTC GATGCCGGGG 
CTGACTTGGC AAGGCAGCCT GGCGGACTTT TGGACGGAGG CTGGTAGCCC GGACATGAAT 
CTCTATCAGG CTTTTCTCGA CTACGTGATG CACCATACGC AGATCAACGG AGATTTCTAT 
ACGCGCACCG GTATAGAGAT GAGCGTCGCC GGCGCCGTGA GCCGGCTCGA GGCGGTGTCG 
TGA

Protein sequence

MSRFFLALQG TASPFFGRLA AGLGQRGHQV RRVNFCGGDL AYQGSESAWN YRDEPEGLVA 
WYRDAIATNG VTDVLLFGDC RAIHRPMHEI ARASGVRVHV FEEGYVRPHW ITMERHGVNG 
RSLLPRDPAY YLDARRHIPP AVPGKPTGYN LYERACHDIR YRMANALYAH RFPHYKSHRP 
RNGLQEYAGL AYRAVQQHVR DREAENVTRD LLERKRRYYL FPLQLNSDSQ IVDHSPFGGI 
CDAIAIVLHS FAENAPDDSW LVIKNHPLDT GLIGYRQFAT ALATELGIEK RMAFIDAGHL 
PTLLDQCRGV VVINSTVGLS AVHHRRPLVA LGTAIYSMPG LTWQGSLADF WTEAGSPDMN 
LYQAFLDYVM HHTQINGDFY TRTGIEMSVA GAVSRLEAVS