Gene BURPS1106A_2807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2807
Symbol
ID	4902077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2765569
End bp	2766717
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	68%
IMG OID	640136033
Product	putative periplasmic substrate-binding protein
Protein accession	YP_001067057
Protein GI	126453860
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGACTCC GCTCGTCACT GCCCTCCCTC GCCCTCGCCG CGGCATTCGC GTGCGGCGCA 
ACCGGCGCCG CGCGCGCCGC CGACGAAACG CCCGTGAGGA TCGGCTTCGC CGCGCCGCTC 
ACGGGCGTCA ACGCGGGCTA CGGCAAGGAT CTGCAAAACG GCGTGCAGCT CGCGCTCGAC 
GACGCCCGCG CGCAAAAGAT CACGATCGCC GGCAAGCCCG CGCGCCTCGA ACTCGTCGTC 
GAGGACGACC AGGCCGATCC GCGGATCGGC GTGCAGGCCG CGCAGAGCCT CGTCGACAAA 
AAGGTGTCGG TCGTCGTCGG CCACTTCAAC TCCGGCACGA CGATTCCGGC GTCGGTCGTC 
TACGACAAGG CGGGCATCCC CGTCATCGAT CCGGCCGCGA CGAATCCCGT CATCACGTCG 
CGCGGGCTCG CGAACGTGTT CATGGTGATC GCCACCGACG GCCAGAACGC CGGCAACGCG 
GGCCGCTACG CGGTCGACGT GACGAAGGCC AAGCGCATCG CGATCGTCGA CGATCGCACC 
GCGTTCGGCC AGGGCGAAGC CGACGAGTTC GACAAGGCGG TGAAGGCCGC GGGCGCCGCG 
ATCGTCGCGC GCGAGTACAC GAGCAACCAG GCGGTCGACT TCCGCGCGCA GATCACGAGC 
CTCAAGAGCA AGAACGTCGA TCTGGTCTTC TTCGGCGGCC TCGATTCGCT CGCGGCGAAC 
TTCATCAAGC AGATGAAGCA GCTCGGCTTG AACGCGCAGT TCGTCGGCGG CGGCGGCGTG 
AAGGACGCCG AGTTCATCAA GATCGCGGGC CCCGCAGCGG AAGGCGCGAT GGCGTGGGAA 
TACGGCCGGC CGCTCGACCA GTTGCCGCAA GGCAAGGATT TCGAGTCGCG CTTCAAGAAG 
CGCTTCGGCG TCGACGTGCT GTCGTATGCG CAGTTCGGCT ATGACGCGAC GTGGGCCGCG 
ATCAAGGCGA TGCAGGCGGC GGGCACGACC GATCCGAGCG GCTATCGGCC CGCGCTGAAG 
AAGATCGATT TCGAGGGCAT CACCGGCCGC ATCTCGTTCG GCGGCGACGG CTCGCTCAAG 
AGCGGGATGT CGACGCTCTA TCAGGTGAAG AGCGGCGCGT GGCAGACGAT CGTCACGAAG 
GGGGGCTGA

Protein sequence

MRLRSSLPSL ALAAAFACGA TGAARAADET PVRIGFAAPL TGVNAGYGKD LQNGVQLALD 
DARAQKITIA GKPARLELVV EDDQADPRIG VQAAQSLVDK KVSVVVGHFN SGTTIPASVV 
YDKAGIPVID PAATNPVITS RGLANVFMVI ATDGQNAGNA GRYAVDVTKA KRIAIVDDRT 
AFGQGEADEF DKAVKAAGAA IVAREYTSNQ AVDFRAQITS LKSKNVDLVF FGGLDSLAAN 
FIKQMKQLGL NAQFVGGGGV KDAEFIKIAG PAAEGAMAWE YGRPLDQLPQ GKDFESRFKK 
RFGVDVLSYA QFGYDATWAA IKAMQAAGTT DPSGYRPALK KIDFEGITGR ISFGGDGSLK 
SGMSTLYQVK SGAWQTIVTK GG