Gene BURPS668_A1739 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1739
Symbol
ID	4886243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	1685024
End bp	1686304
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	69%
IMG OID	640131677
Product	ABC-type sugar transport system, periplasmic component
Protein accession	YP_001062734
Protein GI	126445207
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATACGA TACGATTGCT TGGCGCCGCC GCGCTCGTCG GCGCATGCGC GCCGCTCGCG 
GCGGCGGCCG CGACGCCAGT CTGCAAGGTG CCGACGCTGA AGGTCCTCGC GCAGAAGAGC 
CTCGGGCTCT CGGTGATGGA GAAATCGCTG CCCGACTACG AGAAGACGAG CGGCACCCGG 
ATCGAGATCA ATTACTTCGG CGAGAACGAC CGCCGTGCGA AATCGCGTCT CGACGCGTCG 
ACGGGCGCGG GCTCGTATCA GATCTACTAC GTCGACGAGG CGAACGTCGC CGAATTCGCA 
TCGGCCGGCT GGATCGCGCC GCTCCTCAAG TACTACCCGA AGGAATACGA TTACGACGAC 
TTCCTGCCGG GCCGCCGCGC GGTGGCGAGC TACAAGGGCG TCGCGTACTT CGCGCCGCTC 
ATCGGCGGGG GCGATTTCCT GTTCTACCGG CGCGACCTCC TCGACGCCGC GCACCTGCCG 
GTGCCGAAGA CGCTGGACGA ACTCGTCGCC GCGGTCCGCA AGCTGAACGC GCCGCCGAAG 
CTGTACGGCT GGGTCGCGCG CGGCCAGCGC GGCTCGGGCA TGAACGTGTG GCGCTGGGCG 
CCGTTCATGC TCGCGCAGGG CGGCGCATGG ACCGACCCGC ACGGCCAGCC GGCGTTCAAC 
TCGCCCTCCG CGGTGCAGGC GACCGAGCGC TACCGCGATC TCTTCAAGTA CGCGCCGCCG 
GGCGCCGCGA CCTACGACTG GAGCAACGCG CTCGAAGCGT TCCGCTCGGG CAAGGTCGCG 
TTCATGATCG AATCGACGCC GTTCGCCGAC TGGATGGAGG ACCCATCCAA GTCGAGCGTC 
GCGGGCAAGG TCGGCTACGC GAGGCCGCCC GCGCCGCTGC CGTCGGCCGC TTACGGGCAC 
GGGCTCGCGA TCTCGTCGGT CGGCGCGAAG GACGACTGCG CGCGGCAGGC GGCGGGCCGC 
TTCATCGCAT GGGCGACGAG CAAGGAGCAG GAGCAGGCGC GGCTGCGCAA CGGCGTGTTC 
AGCGACTACA ACCGCACGAG CACGATCGGC AGCGACTACT TCAGGCAGCA CGTGAAGCCG 
CAGATCCTCG CCGGCCTGAA CGATACGAAC CCGGTGACGA AGGCGACGAT CTGGGCGACG 
CCGCAATGGC CCGATATCGG CGACAACCTC GGCGTCGCGC TCGAGGAAGT CTTCACCGGC 
ACGCAGACCG ACGTGCGCGG CGCGCTCGAC GACGCGGCGC AGTACGCGAA GGACGCGATG 
GCGCACGGCG CGCGCAAGTG A

Protein sequence

MNTIRLLGAA ALVGACAPLA AAAATPVCKV PTLKVLAQKS LGLSVMEKSL PDYEKTSGTR 
IEINYFGEND RRAKSRLDAS TGAGSYQIYY VDEANVAEFA SAGWIAPLLK YYPKEYDYDD 
FLPGRRAVAS YKGVAYFAPL IGGGDFLFYR RDLLDAAHLP VPKTLDELVA AVRKLNAPPK 
LYGWVARGQR GSGMNVWRWA PFMLAQGGAW TDPHGQPAFN SPSAVQATER YRDLFKYAPP 
GAATYDWSNA LEAFRSGKVA FMIESTPFAD WMEDPSKSSV AGKVGYARPP APLPSAAYGH 
GLAISSVGAK DDCARQAAGR FIAWATSKEQ EQARLRNGVF SDYNRTSTIG SDYFRQHVKP 
QILAGLNDTN PVTKATIWAT PQWPDIGDNL GVALEEVFTG TQTDVRGALD DAAQYAKDAM 
AHGARK