Gene BURPS1710b_A2122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A2122
Symbol
ID	3694452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	2585594
End bp	2586733
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	68%
IMG OID	637732376
Product	glycine betaine ABC transporter substrate-binding protein
Protein accession	YP_337273
Protein GI	76817784
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGACTGG CAGCCGTTCC AGGATGCGAG CCAGCGTTAC ATGCGCAATC ACCTCGAACT 
CGACGCGCTC GAGGCAGCCG CGCGTTTTCC TCGTCCGCAC GCATGACGCC CGGCGTCACG 
CATTTTCAAA TGGAGCAAGC GATGAAACGA TACGAATCCA TTGCGCGGCG GCTCGCGCGC 
CGCGCGGCAG CCGCATCGCC GGCGTTCGCG GCGTTGGCAT GGTGCGCCGC GGCGGCCGCC 
GCCACGACCA CGGCGGCCGC GGCGGAGCCG GCCGCCTGTC GCGACGTGCG GATGGCCGGC 
CCCGGCTGGA CCGATATCGA AGCGACGAAC GCGCTCGCGG GCGTCGTGCT GAAGGCGCTC 
GGTTACCGGC AGAGCGTGTC GAACCTGTCG GTGCCGATCA CGTATCAAGG TCTGAAGAAA 
GGGCAGCTCG ACGTGTTCCT CGGCAACTGG ATGCCGGCGC AGGCGCCGCT CGTCAAGCCG 
TTCGTCGACG CGCGCGCGAT CGACGTGCTC CACGCGAACC TGAGCCATGC GAAATTCACG 
CTCGCGGTGC CGGACTACGT GGCGGCGGCG GGCGTGCATT CGTTCGCCGA CCTCGCGAAG 
TACGCGCAGC GCTTCGGCGC GAAGATCTAC GGCATCGAGC CGGGCGCGCC GGCCAATCAG 
AACATCTCGC GCATGCTCGC CGACAAGGCG CTCGGGCCGG CGAACTGGCA GCTCGTCGAA 
TCGAGCGAGA CAGGGATGCT GACGCAGGTC GAGCGCGCGG TGCGCGAGCG CCAGTGGATC 
GTGTTTCTCG GCTGGGAGCC GCACCTGATG AACACGAAAT TCCATCTCGT TTATCTGTCG 
GGCGGCGACG CGTATTTCGG GCCGGACTAC GGCGGCGCGA CCGTCAACAC CGTCGCGCGC 
GCGGATTTCG CGAGCCAGTG CGCGAATCTC GCGCGGCTGT TCCGACAAAT GACGTTCACC 
GTCGATCTGG AGAACGGAAT GATCGCCGCG ATGCTGCAGG GCAAGCGCTC CGCCGTGGAT 
GCCGCGCAAC ACGCGCTGCG TGCGAACCCG TCGCTCGTCG AAGCATGGCT CGACGGCGTG 
CGCACCGCGA GCGGCGCGCC GGGCTTGCCT GCGGTGCGCG CGGCGCTCGA TGCGCAATGA

Protein sequence

MGLAAVPGCE PALHAQSPRT RRARGSRAFS SSARMTPGVT HFQMEQAMKR YESIARRLAR 
RAAAASPAFA ALAWCAAAAA ATTTAAAAEP AACRDVRMAG PGWTDIEATN ALAGVVLKAL 
GYRQSVSNLS VPITYQGLKK GQLDVFLGNW MPAQAPLVKP FVDARAIDVL HANLSHAKFT 
LAVPDYVAAA GVHSFADLAK YAQRFGAKIY GIEPGAPANQ NISRMLADKA LGPANWQLVE 
SSETGMLTQV ERAVRERQWI VFLGWEPHLM NTKFHLVYLS GGDAYFGPDY GGATVNTVAR 
ADFASQCANL ARLFRQMTFT VDLENGMIAA MLQGKRSAVD AAQHALRANP SLVEAWLDGV 
RTASGAPGLP AVRAALDAQ