Gene BURPS1106A_A1930 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1930
Symbol	proX
ID	4905057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	1890003
End bp	1890989
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	64%
IMG OID	640145036
Product	glycine betaine/L-proline ABC transporter, periplasmic glycine betaine/L-proline-binding protein
Protein accession	YP_001075964
Protein GI	126455720
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID	[TIGR03414] choline ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.111406
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGACGA CATCTTTGAT GATGAGGAGA AGCACGATGA AGCGAAATCT GATCGCGGCG 
GCCTGCGGGC TCGCCATCGC GGCCGCGCCG TTCGCGAGCG CCCGGGCGGG CGATGCGCCG 
ACCTGCAAGG CGGTGCGCTT TGCGGATGTC GGCTGGACCG ACATCGCCGC GACGACGGGG 
CTCGCGTCGA CGATGCTCGC CGGGCTCGGC TATGCGCCGA CGAAGACGAT CGCTTCGGTG 
CCGATCACGT TCGCGGGGAT CAAGAGCAAG CAGATCGACG TGTTTCTCGG CTACTGGTCG 
CCGACGATGG ACCCGATGAT CGCGCCGTTC ACGAAGGCGG GCACGATCAA GGTGCTCGCC 
GCGCCGAATC TGACGGGCGC GAAGTACACG CTCGCCGTGC CCGATTACGT GTATCAGGGC 
GGCCTGAAAT CGTTCGCCGA CATCCAGAAA TACGCGGACA AGCTCAACGG CAGGATCTAC 
GGGATCGAGC CCGGCAACGA CGGCAACGCG CTCATCAAGA AGATGATCGA CGGCAACCAG 
TTCGGCCTCG GCAAGTTCAA GCTCGTCGAA TCGAGCGAGG CGGGGATGCT CGTCGAGGTG 
AACCGCGCGA TCCGCGACAA GCAGTGGATC GTGTTCCTCG GCTGGGAGCC GCATCCGATG 
AACGTGCAGA TGAAGATCGA TTACCTGAGC GGCGGCGACG ACGTGTTCGG CCCGAACTAC 
GGCGAGGCGA AGGTGCTGAC CGCCACGCCG CCCGATTACG CGGCGCGTTG CCCGAACGTC 
GCGAAGTTCG TGTCGAACCT GCAGTTCACG ACATCGATCG AGAACCATGT GATGCTGCCG 
ATCATGAACA AGGAAGACCC GAACAAGGCG GCGGCCGAAT GGCTGAAGGC GAATCCGCAG 
TCGCTCGACA AGTGGCTCGC CGGCGTGACG ACGTTCGACG GCAAGCCGGG GCTGCCGGCC 
GTCAAGCACT ACCTCGGCAT TCAGTAA

Protein sequence

MLTTSLMMRR STMKRNLIAA ACGLAIAAAP FASARAGDAP TCKAVRFADV GWTDIAATTG 
LASTMLAGLG YAPTKTIASV PITFAGIKSK QIDVFLGYWS PTMDPMIAPF TKAGTIKVLA 
APNLTGAKYT LAVPDYVYQG GLKSFADIQK YADKLNGRIY GIEPGNDGNA LIKKMIDGNQ 
FGLGKFKLVE SSEAGMLVEV NRAIRDKQWI VFLGWEPHPM NVQMKIDYLS GGDDVFGPNY 
GEAKVLTATP PDYAARCPNV AKFVSNLQFT TSIENHVMLP IMNKEDPNKA AAEWLKANPQ 
SLDKWLAGVT TFDGKPGLPA VKHYLGIQ