Gene BURPS668_3249 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3249
Symbol
ID	4881721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	3183243
End bp	3184526
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	56%
IMG OID	640129177
Product	putative capsular polysaccharide biosynthesis protein
Protein accession	YP_001060260
Protein GI	126439225
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCAGTC GGGAGCGGCT GGCGCGCCAA ATTGTGTTCC ATCACATTCC CAAGACGGCG 
GGATCGTCGT TCAATCAGAT ACTTCGCACG CTATATCGCG ACGACGAAGT ATGCGACGCT 
GCGTTGGATG ACGAACTCGA TGAAGTGATG GCCGACGAGA CGCGTCGTTA CGAGCTGTTT 
GTCGGGCATT TCAGCTTCGA CGCGCTGCAT CGGCACTTCG GCGGCGCCAC GCGTTTGACT 
TTTCTTCGCG ATCCGGTTCA GCGCTGTATT TCCCAGTATC ACAACTGGCA TGACGCTTCG 
CGCTATTCGG ATGCGTGGAT CGGGCGCAGC GACACGAATC CGGACGTCAT CAAGGCGCTG 
AAGATGACGT CCGAGATGTC GCTTTGTGAA TTTGTGAGTT CGGATAATCT CGTGATTTCC 
GACAGCGCTC AAAACATGAT GACTCGCTAC CTCGCGCCGA GCGTCGAATG GAAGAAGGAG 
CGTGGATACT ATGACGCCGA GCTTGTCGAG AAAGCCAAGC GCAATCTCGT CGAGTATTTT 
CATTTTTTTG GCCTGACCGA GCAATTTGAT CGTTCACTAG TGCTTCTTGC GCATACCCTC 
GGTATCCGCC CATGGGAACG GAGCGATGCA CTGCTAACTA ATCGAAATCC GAAGAAGGCT 
TCGTTCGACA GTGTTTACAA TACCACGCCA GAAGAAGGCG GTGTTTTACG CGATTACAAC 
TTGATGGATA TCGAGTTGTA CGAGTTCGCG GTAAAGGAAT TCAATCGCCG CTTCGACGCG 
GGATACCAGA AGCTTGTGGA GTGCGCCTTT GAGTATCTCG CTGACAAGGA CACTCGCGAC 
ATGGGTAATG CTGGCGATTT TTACGCGTTC GACATGACGA ACGCAGTCGG CGCCCGAGGT 
TTGCATTTTC TGGAATCCAC CCGGTTGCCG TGTGGTGCGA ATGTTCTTGG ACGTTGGACA 
GGGCTGGAGC CGCGAGCTGT ATGGGAGATT CCGCTTCGCG CGGGGCGCGA CAGCCATGTC 
GTGATCGAAG TGGACTATAT CGATAGCGTG TCGCCGGAGG CCCTGGCGCC GGAGCATTTC 
ACGTTAAACG GCATGCCGGC CAGGCAGCAT GCGTTCAGCG CGGAGGGCTC GATCCAGCGT 
CTGCGCCTGG TCTTTTCCGC CGGCGCCGCG CTTGCCGGCA GAATGTTGCA CACGCTGAAA 
TTGACTACTC CGCTTGTGCG TGCGGAAGAC GGAACGCGCG ACGTTGGAGT GCTTCTATTG 
CGCTTGCAGT CTTACAGCGT TTAG

Protein sequence

MRSRERLARQ IVFHHIPKTA GSSFNQILRT LYRDDEVCDA ALDDELDEVM ADETRRYELF 
VGHFSFDALH RHFGGATRLT FLRDPVQRCI SQYHNWHDAS RYSDAWIGRS DTNPDVIKAL 
KMTSEMSLCE FVSSDNLVIS DSAQNMMTRY LAPSVEWKKE RGYYDAELVE KAKRNLVEYF 
HFFGLTEQFD RSLVLLAHTL GIRPWERSDA LLTNRNPKKA SFDSVYNTTP EEGGVLRDYN 
LMDIELYEFA VKEFNRRFDA GYQKLVECAF EYLADKDTRD MGNAGDFYAF DMTNAVGARG 
LHFLESTRLP CGANVLGRWT GLEPRAVWEI PLRAGRDSHV VIEVDYIDSV SPEALAPEHF 
TLNGMPARQH AFSAEGSIQR LRLVFSAGAA LAGRMLHTLK LTTPLVRAED GTRDVGVLLL 
RLQSYSV