Gene BURPS668_1847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1847
Symbol
ID	4883580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1808301
End bp	1809338
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	67%
IMG OID	640127775
Product	sulfate/thiosulfate ABC transporter, periplasmic sulfate-binding protein
Protein accession	YP_001058882
Protein GI	126438507
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCAAGC GCAACACGGG GCTGGCAGGC GGCGCGCGCC GTCTCATCGC ATCATTGGCG 
CTCGGCGCGG CGGCGGCGCT CGGCGCGCTC ACGCCGGCGC TCGCGGACAC GACGTTCCTG 
AACGTTTCGT ACGACCCGAC GCGCGAACTC TACCAGGACG TCAACCAGGC GTTCGGCAAG 
GAATGGAAGG CGAGGACGGG CGAGACGGTG AACTTCAAGC AGTCGCACGG CGGCTCGGGC 
GCGCAGGCGC GCTCGGTGCT CGACGGGCTG CAGGCCGACG TGGTCACGCT CGCGCTCGCG 
TACGACATCG ACGCGCTCGC GAACAAGGGC CTCGTCAGCA AGGATTGGCA AAAGCGTCTG 
CCGGACAACG CGTCGCCGTA CACGTCGACG ATCGTGTTCC TCGTGAGGAA GGGCAATCCG 
AAGGGCATCA AGGATTGGGA CGATCTCGTG AAGCCGGGCG TGTCGATCGT CACGCCGAAC 
CCGAAAACCT CGGGCGGCGC GCGCTGGAAC TACCTCGCCG CGTGGGCATA CGCGCAGCAC 
CAGCCGGGCG GCACGGCGCA GACGGCGAAG GATTTCGTCA CGAAGCTGTA CAGGAACGCG 
GGCGTGCTCG ACTCGGGCGC GCGCGGCGCG ACGACGAGCT TCGTGCAGCG CGGCATCGGC 
GACGTGCTGA TCGCGTGGGA AAACGAGGCG TTCCTGTCGA TCAAGGAATT CGGCGCCGAC 
AAGTTCGAGA TCGTCGTGCC GTCGGCGAGC ATTCTCGCGG AGCCGCCGGT GGCGGTGGTC 
GACAAGGTGG TCGACAAGAA GGGCACGCGC AAGCTCGCCG ACGCGTACCT GAACTTCCTG 
TACAGCAGGC AAGGGCAGGA GATCGCCGCG CGCAACTACT ACCGGCCGCG CTCGCGGGAC 
GTGCCGGCGG CGCTCACGAA GCAGTTCCCG AAGCTCAAGC TGTACACGGT CGACGACACG 
TTCGGCGGCT GGACCCAAGC GCAGAAGACG CATTTCGCCG ACGGCGGCGT GTTCGATTCG 
ATCTACAAGC CGCAGTGA

Protein sequence

MVKRNTGLAG GARRLIASLA LGAAAALGAL TPALADTTFL NVSYDPTREL YQDVNQAFGK 
EWKARTGETV NFKQSHGGSG AQARSVLDGL QADVVTLALA YDIDALANKG LVSKDWQKRL 
PDNASPYTST IVFLVRKGNP KGIKDWDDLV KPGVSIVTPN PKTSGGARWN YLAAWAYAQH 
QPGGTAQTAK DFVTKLYRNA GVLDSGARGA TTSFVQRGIG DVLIAWENEA FLSIKEFGAD 
KFEIVVPSAS ILAEPPVAVV DKVVDKKGTR KLADAYLNFL YSRQGQEIAA RNYYRPRSRD 
VPAALTKQFP KLKLYTVDDT FGGWTQAQKT HFADGGVFDS IYKPQ