Gene BMASAVP1_A1698 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A1698
Symbol	sbp
ID	4679603
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	-
Start bp	1691359
End bp	1692396
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	67%
IMG OID	639845965
Product	sulfate/thiosulfate ABC transporter, sulfate-binding protein
Protein accession	YP_993024
Protein GI	121600537
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0701208
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCAAGC GCAACACGGG GCTGGCAGGC GGCGCGCGCC GTCTCATCGC ATCATTGGCG 
CTCGGCGCGG CGGCGGCGCT CGGCGCGCTC ACGCCGGCGC TCGCGGACAC GACGTTCCTG 
AACGTTTCGT ACGACCCGAC GCGCGAGCTC TACCAGGACG TCAACCAGGC GTTCGGCAAG 
GAATGGAAGG CGAGGACGGG CGAGACGGTG AACTTCAAGC AGTCGCACGG CGGCTCGGGC 
GCGCAGGCGC GCTCGGTGCT CGACGGGCTG CAGGCCGACG TGGTCACGCT CGCGCTCGCG 
TACGACATCG ACGCGCTCGC GAACAAGGGC CTCGTCAGCA AGGATTGGCA AAAGCGTCTG 
CCGGACAACG CGTCGCCGTA CACGTCGACG ATCGTGTTCC TCGTGAGGAA GGGCAATCCG 
AAGGGCATCA AGGATTGGGA CGATCTCGTG AAGCCGGGCG TGTCGATCGT CACGCCGAAC 
CCGAAAACCT CGGGCGGCGC GCGCTGGAAC TACCTCGCCG CGTGGGCATA CGCGCAGCAC 
CAGCCGGGCG GCACGGCGCA GACGGCGAAG GATTTCGTCA CGAAGCTGTA CAGGAACGCG 
GGCGTGCTCG ACTCGGGCGC GCGCGGCGCG ACGACGAGCT TCGTGCAGCG CGGCATCGGC 
GACGTGCTGA TCGCGTGGGA AAACGAGGCG TTCCTGTCGA TCAAGGAATT CGGCGCCGAC 
AAGTTCGAGA TCGTCGTGCC GTCGGCGAGC ATTCTCGCGG AGCCGCCGGT GGCGGTGGTC 
GACAAGGTGG TCGACAAGAA GGGCACGCGC AAGCTCGCCG ACGCGTACCT GAACTTCCTG 
TACAGCAGGC AAGGGCAGGA GATCGCCGCG CGCAACTACT ACCGGCCGCG CTCGCGGGAC 
GTGCCGGCGG CGCTCACGAA GCAGTTCCCG AAGCTCAAGC TGTACACGGT CGACGACACG 
TTCGGCGGCT GGACCCAAGC GCAGAAGACG CATTTCGCCG ACGGCGGCGT GTTCGATTCG 
ATCTACAAGC CGCAGTGA

Protein sequence

MVKRNTGLAG GARRLIASLA LGAAAALGAL TPALADTTFL NVSYDPTREL YQDVNQAFGK 
EWKARTGETV NFKQSHGGSG AQARSVLDGL QADVVTLALA YDIDALANKG LVSKDWQKRL 
PDNASPYTST IVFLVRKGNP KGIKDWDDLV KPGVSIVTPN PKTSGGARWN YLAAWAYAQH 
QPGGTAQTAK DFVTKLYRNA GVLDSGARGA TTSFVQRGIG DVLIAWENEA FLSIKEFGAD 
KFEIVVPSAS ILAEPPVAVV DKVVDKKGTR KLADAYLNFL YSRQGQEIAA RNYYRPRSRD 
VPAALTKQFP KLKLYTVDDT FGGWTQAQKT HFADGGVFDS IYKPQ