Gene BURPS1710b_1991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_1991
Symbol	ssuB
ID	3691802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	2163920
End bp	2164927
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	75%
IMG OID	637728447
Product	aliphatic sulfonate ABC transporter, ATP-binding protein
Protein accession	YP_333387
Protein GI	76810819
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1116] ABC-type nitrate/sulfonate/bicarbonate transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0937962
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGGCA CCACGCTGGC CGCCACGTAC GGCCCGATCT CGGGCGCGGA CCTCGAGGCC 
GAGCTCGCGC AGCCGCGCAT CGCCGACGGT GATGCGCAGG ACGCCGCCGT GTACGAGCGC 
GACGGCGGCG CGCACGCGCC GCCGTTCGCG TCGGGCGGCG CGCCGCCCGA CGGCGACCGC 
GCCGATGTGC GGCGCGCAGC AGGAGCAGGC GACGCGTCGG TGCGCCTCAC GCGCGTGAGC 
AAGCGCTACG GCGAGCGGGC CGTGCTCGCC GACGTCGATC TGTCGATCGG GCGCGGCAGT 
TTCGTCTCGA TCGTCGGGCG CAGCGGCTGC GGGAAATCCA CGCTGCTGCG CCTCGTCGCG 
GAGCTCGAGA CGCCGAGCGC CGGCACGCTC GTCAAGCGCG GCGACGGCGG CGGCGCGCTC 
GATACGCGGA TCATGTATCA GGAGGCGCGC CTGTTGCCGT GGAAGACCGT GCTGCAGAAC 
GTGATGCTCG GCCTCGGCCG GCGCGCGAAG GACGACGCGC GGGCGGTGCT CGACGAAGTC 
GGGCTACTCG CGCGCGCGAA CGATTGGCCC GCACAACTCT CGGGCGGGCA GCGGCAGCGC 
GTCGCGCTCG CGCGGGCGCT CGTCCATCGC CCGCAACTGT TGCTGCTCGA CGAGCCGCTC 
GGCGCGCTCG ATGCGCTCAC GCGCATCGAA ATGCACGCGC TGATCGAGCG CCTGTGGCGC 
GAGCATCGCT TCACCGCGCT GCTCGTCACG CACGACGTGC AGGAGGCGGT CGCGCTCGCC 
GACAGGGTCC TGCTCATCGA AGCGGGCCGG ATCGCGTTCG ATCAGCGGGT GCCGCTCGAT 
CGGCCGCGCG CGCGGGCGTC GGCGGCGTTC GCCGCGCTCG AGGATCGCGT GCTGCAGCGC 
GTATTGACGG GCTCGGATGC CGCGCCCGCG GCGCCGAACG CTGCGGGCCC GGAGGGCGCG 
TCGCGCGGCC GCGCCGCGCC GGCAAGCGGA TTGCGCTGGG CGGTATGA

Protein sequence

MTGTTLAATY GPISGADLEA ELAQPRIADG DAQDAAVYER DGGAHAPPFA SGGAPPDGDR 
ADVRRAAGAG DASVRLTRVS KRYGERAVLA DVDLSIGRGS FVSIVGRSGC GKSTLLRLVA 
ELETPSAGTL VKRGDGGGAL DTRIMYQEAR LLPWKTVLQN VMLGLGRRAK DDARAVLDEV 
GLLARANDWP AQLSGGQRQR VALARALVHR PQLLLLDEPL GALDALTRIE MHALIERLWR 
EHRFTALLVT HDVQEAVALA DRVLLIEAGR IAFDQRVPLD RPRARASAAF AALEDRVLQR 
VLTGSDAAPA APNAAGPEGA SRGRAAPASG LRWAV