Gene BURPS1106A_0256 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0256
Symbol	dppA
ID	4899380
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	238285
End bp	239913
Gene Length	1629 bp
Protein Length	542 aa
Translation table	11
GC content	63%
IMG OID	640133486
Product	dipeptide ABC transporter, periplasmic dipeptide-binding protein DppA
Protein accession	YP_001064539
Protein GI	126454101
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACATA ACCGTCTGTT GCGCGCACTG CGTGCTACCG CCATCGCGGG CGTTGCAGCG 
GCATCGTTCG GCATCGCGGG TTCTGCATTC GCACAGATCC CGAACAAAAC GCTCGTCTAC 
TGCTCAGAAG GCAGCCCGGC GGGCTTCGAT TCCGCGCAAT TCACGACGGG CGTCGATTTC 
ACCGCGTCGA CGTTCCCGAT CTACAACCGC CTCGTCGAAT TCGAGCGCGG CGGCACGAAG 
GTCGAGCCGG GCCTCGCCGA GAAGTGGGAC ATCTCGGCCG ACGGCAAGGT CTACACGTTC 
CATCTGCGCC ACGGCGTCAA GTTCCATACG ACCGATTTCT TCAAGCCCAC GCGCGAATTC 
AACGCGGACG ACGTCGCGTT CACGTTCGAG CGGATGCTCG ATCCGAATCA GGCGTTTCGC 
AAGGCGTACC CGGTGTCGTT CCCGTACTTC ACCGACATGG GCCTCGACAA GCTGATCGTG 
AAGATCGAGA AGCTCGATCC GTACACGGTC CGCTTCACGC TGAAGGAGCC GAACGCGCCG 
TTCATCCAGA ACCTCGCGAT GGAATTCGCG TCGATCCTCT CGGCCGAATA CGCGGACCAA 
CTGATGAAGG CGGGCAAGGC GGCCGACATC AACCAGAAGC CGATCGGCAC GGGCCCGTTC 
ATCTTCCGCA GCTACACGAA GGACGCGACG ATCCGCTTCG ACGGCAATCC TGATTATTGG 
AAGAAGGGCG CGGTGAAGAT CTCGAAGCTG ATCTTCTCGA TCACGCCCGA CCCGGGCGTG 
CGCGTGCAGA AGATCAAGCG CAACGAGTGC CAGGTGATGA GCTATCCGCG GCCCGCGGAC 
ATCGCGACGC TGAAGGCCGA TTCGAACGTC GACATGCCGT CGCTGCCGGG CTTCAACCTC 
GGCTACCTCG CGTACAACGT GCAGCACAAG CCCGTCGACA AGCTCGAAGT GCGCCAGGCG 
CTCGACATGG CGATCAACAA GAAGGCGATT CTCGAATCCG TCTATCAGGG CGCGGGCCAG 
GCGGCGAGCG CGCCGATGCC GCCGACCCAA TGGTCGTACG ACAAGAACCT GAAGGCCGCC 
GCCTACGATC CGGCGAAGGC GAAGGCGCTG CTCGCGAAGG CGGGCTACCC GAACGGCTTC 
CCGATCACGC TGTGGGCGAT GCCCGTGCAG CGCCCGTACA ACCCGAACGC GAAGCTGATG 
GCCGAGATGA TCCAGGCCGA CTGGGCGAAG ATCGGCGTGC AGGCGAAGAT CGTCACGTAC 
GAGTGGGGCG AGTACATCAA GCGCGCGCAT GCGGGCGAGC ACGATACGAT GCTGATCGGC 
TGGAACGGCG ACAACGGCGA TCCCGACAAC TGGCTCGGCA CGCTGCTCGG CTGCGAGGCG 
GTCAAGGGCA ACAACTTCTC CGAGTGGTGC TACAAGCCGT TCGACGAGCT GATCCAGAAG 
GGCCGCGTGA CGACGTCGCA GGACGGCCGC ACGAAGATCT ACATGCAGGC GCAGCAGATC 
TTCGCGCAGC AACTGCCGTT CTCGCCGATC GCGAACTCGA CCGTCTATCA GCCGGTGCGC 
AAGAACATCG TCGACATGCG GATCGAGCCG CTCGGCTATG CGCGCTTCGA CGGCGTCAGC 
GTGAAATAA

Protein sequence

MEHNRLLRAL RATAIAGVAA ASFGIAGSAF AQIPNKTLVY CSEGSPAGFD SAQFTTGVDF 
TASTFPIYNR LVEFERGGTK VEPGLAEKWD ISADGKVYTF HLRHGVKFHT TDFFKPTREF 
NADDVAFTFE RMLDPNQAFR KAYPVSFPYF TDMGLDKLIV KIEKLDPYTV RFTLKEPNAP 
FIQNLAMEFA SILSAEYADQ LMKAGKAADI NQKPIGTGPF IFRSYTKDAT IRFDGNPDYW 
KKGAVKISKL IFSITPDPGV RVQKIKRNEC QVMSYPRPAD IATLKADSNV DMPSLPGFNL 
GYLAYNVQHK PVDKLEVRQA LDMAINKKAI LESVYQGAGQ AASAPMPPTQ WSYDKNLKAA 
AYDPAKAKAL LAKAGYPNGF PITLWAMPVQ RPYNPNAKLM AEMIQADWAK IGVQAKIVTY 
EWGEYIKRAH AGEHDTMLIG WNGDNGDPDN WLGTLLGCEA VKGNNFSEWC YKPFDELIQK 
GRVTTSQDGR TKIYMQAQQI FAQQLPFSPI ANSTVYQPVR KNIVDMRIEP LGYARFDGVS 
VK