Gene BURPS668_2747 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2747
Symbol
ID	4885475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	2716144
End bp	2717292
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	67%
IMG OID	640128674
Product	putative periplasmic substrate-binding protein
Protein accession	YP_001059770
Protein GI	126439421
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.312608
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACTCC GCTCGTCACT GCCCTCCCTC GCCCTCGCCG CGGCATTCGC GTGCGGCGCA 
ACCGGCGCCG CGCGCGCCGC CGACGAAACG CCCGTGAGGA TCGGCTTCGC CGCGCCGCTC 
ACGGGCGTCA ACGCGGGCTA CGGCAAGGAT CTGCAAAACG GCGTGCAGCT CGCGCTCGAC 
GACGCCCGCG CGCAAAAGAT CACGATCGCC GGCAAGCCCG CGCGCTTCGA ACTCGTCGTC 
GAGGACGACC AGGCCGATCC GCGGATCGGC GTGCAGGCCG CGCAGAGCCT CGTCGACAAA 
AAGGTGTCGG TCGTCGTCGG CCACTTCAAC TCCGGCACGA CGATTCCGGC GTCGGTCGTC 
TACGACAAGG CGGGCATCCC CGTCATCGAT CCGGCCGCGA CGAATCCCGT CATCACGTCG 
CGCGGGCTCG CGAACGTGTT CATGGTGATC GCCACCGACG GCCAGAACGC CGGCAACGCG 
GGCCGCTACG CGGTCGACGT GACGAAGGCC AAGCGCATCG CGATCGTCGA CGATCGCACC 
GCGTTCGGCC AGGGCGAAGC CGACGAGTTC GACAAGGCGG TGAAGGCCGC GGGCGCCGCG 
ATCGTCGCGC GCGAGTACAC GAGCAACCAG GCGGTCGACT TCCGCGCGCA GATCACGAGC 
CTCAAGAGCA AGAACGTCGA TCTGGTCTTC TTCGGCGGCC TCGATTCGCT CGCGGCGAAC 
TTCATCAAGC AGATGAAGCA ACTCGGCTTG AACGCGCAGT TCGTCGGCGG CGGCGGCGTG 
AAGGACGCCG AGTTCATCAA GATCGCGGGC CCCGCAGCGG AAGGCGCGAT GGCGTGGGAA 
TACGGCCGGC CGCTCGACCA GTTGCCGCAA GGCAAGGATT TCGAGTCGCG CTTCAAGAAG 
CGCTTCGGCG TCGACGTGCT GTCGTATGCG CAGTTCGGCT ATGACGCGAC GTGGGCCGCG 
ATCAAGGCGA TGCAGGCGGC GGGCACGACC GATCCGAGCG GCTATCGGCC CGCGCTGAAG 
AAGATCGATT TCGAGGGCAT CACCGGCCGC ATCTCGTTCG GCGGCGACGG CTCGCTCAAG 
AGCGGGATGT CGACGCTCTA TCAGGTGAAG AGCGGCGCGT GGCAGACGAT CGTCACGAAG 
GGGGGCTGA

Protein sequence

MRLRSSLPSL ALAAAFACGA TGAARAADET PVRIGFAAPL TGVNAGYGKD LQNGVQLALD 
DARAQKITIA GKPARFELVV EDDQADPRIG VQAAQSLVDK KVSVVVGHFN SGTTIPASVV 
YDKAGIPVID PAATNPVITS RGLANVFMVI ATDGQNAGNA GRYAVDVTKA KRIAIVDDRT 
AFGQGEADEF DKAVKAAGAA IVAREYTSNQ AVDFRAQITS LKSKNVDLVF FGGLDSLAAN 
FIKQMKQLGL NAQFVGGGGV KDAEFIKIAG PAAEGAMAWE YGRPLDQLPQ GKDFESRFKK 
RFGVDVLSYA QFGYDATWAA IKAMQAAGTT DPSGYRPALK KIDFEGITGR ISFGGDGSLK 
SGMSTLYQVK SGAWQTIVTK GG