Gene BURPS1710b_A0447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A0447
Symbol
ID	3693434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	-
Start bp	617456
End bp	618406
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	64%
IMG OID	637730701
Product	glycine betaine/L-proline ABC transporter, periplasmic glycine betaine/L-proline-binding protein
Protein accession	YP_335606
Protein GI	76818565
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCGAA ATCTGATCGC GGCGGCCTGC GGGCTCGCCA TCGCGGCCGC GCCGTTCGCG 
AGCGCCCGGG CGGGCGATGC GCCGACCTGC AAGGCGGTGC GCTTTGCGGA TGTCGGCTGG 
ACCGACATCG CCGCGACGAC GGGGCTCGCG TCGACGATGC TCGCCGGGCT CGGCTATGCG 
CCGACGAAGA CGATCGCTTC GGTGCCGATC ACGTTCGCGG GGATCAAGAG CAAGCAGATC 
GACGTGTTTC TCGGCTACTG GTCGCCGACG ATGGACCCGA TGATCGCGCC GTTCACGAAG 
GCGGGCACGA TCAAGGTGCT CGCCGCGCCG AATCTGACGG GCGCGAAGTA CACGCTCGCC 
GTGCCCGATT ACGTGTATCA GGGCGGCCTG AAATCGTTCG CCGACATCCA GAAATACGCG 
GACAAGCTCA ACGGCAGGAT CTACGGGATC GAGCCCGGCA ACGACGGCAA CGCGCTCATC 
AAGAAGATGA TCGACGGCAA CCAGTTCGGC CTCGGCAAGT TCAAGCTCGT CGAATCGAGC 
GAGGCGGGGA TGCTCGTCGA GGTGAACCGC GCGATCCGCG ACAAGCAGTG GATCGTGTTC 
CTCGGCTGGG AGCCGCATCC GATGAACGTG CAGATGAAGA TCGATTACCT GAGCGGCGGC 
GACGACGTGT TCGGCCCGAA CTACGGCGAG GCGAAGGTGC TGACCGCCAC GCCGCCCGAT 
TACGCGGCGC GTTGCCCGAA CGTCGCGAAG TTCGTGTCGA ACCTGCAGTT CACGACATCG 
ATCGAGAACC ATGTGATGCT GCCGATCATG AACAAGGAAG ACCCGAACAA GGCGGCGGCC 
GAATGGCTGA AGGCGAATCC GCAGTCGCTC GACAAGTGGC TCGCCGGCGT GACGACGTTC 
GACGGCAAGC CGGGGCTGCC GGCCGTCAAG CACTACCTCG GCATTCAGTA A

Protein sequence

MKRNLIAAAC GLAIAAAPFA SARAGDAPTC KAVRFADVGW TDIAATTGLA STMLAGLGYA 
PTKTIASVPI TFAGIKSKQI DVFLGYWSPT MDPMIAPFTK AGTIKVLAAP NLTGAKYTLA 
VPDYVYQGGL KSFADIQKYA DKLNGRIYGI EPGNDGNALI KKMIDGNQFG LGKFKLVESS 
EAGMLVEVNR AIRDKQWIVF LGWEPHPMNV QMKIDYLSGG DDVFGPNYGE AKVLTATPPD 
YAARCPNVAK FVSNLQFTTS IENHVMLPIM NKEDPNKAAA EWLKANPQSL DKWLAGVTTF 
DGKPGLPAVK HYLGIQ