Gene BURPS1106A_0422 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0422
Symbol
ID	4901089
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	387656
End bp	389242
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	66%
IMG OID	640133652
Product	ABC transporter, periplasmic substrate-binding protein
Protein accession	YP_001064705
Protein GI	126452388
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.537378
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTTCA CGCACATCGC CGCCGCCGCG CTCGTCGCCG CCGCTTCCGT CGCCGCCGCG 
AAACCGCTGA CGGTCTGCAC CGAGTCGAGC CCGGACGGCT TCGACGTCGT TCAGTACAAC 
TCGCTCGTCA CGACGAACGC ATCCGCCGAC GTCGTCTTCA ACACGCTCGT GTCGTACGAC 
GAAGCGACGA AAAAGGTGGT GCCCGCGCTC GCGGACAAAT GGGATGTGAG CGCCGACGGC 
CTCGCGTACA CGTTCCATCT GCGCCCGAAC GTCGCGTTCC AGACCACCGA CTCCTTCAAG 
CCGACGCGCG CGCTCGACGC CGACGACGTC GTCTTCACGT TCGGCCGGAT GCTCGACGAC 
GCGAATCCGT GGCACAAGGT CGCGGGCGCG AGCGGCTTTC CGCATGCGCA GTCGATGGGC 
CTCGCGAAGC TCGTGAAGGC GGTCACGAAG ATCGACGAGT CGACCGTGAA GTTCGAACTG 
AACGAACCGA ACGCGACGTT CGTGCCGATC CTCACGATGG GCTTCGCGTC GATCTACTCG 
GCCGAGTACG CGGATCAGCT GCTGAAGGCG GGCAAGCAGG CGGACTTGAA CGCGAAGCCG 
GTCGGCACCG GGCCGTTCGT GCTGAAGAGT TACACGAAGG ACGCGGTGAT CCGCTACGAG 
GCGAACCCGA CGTACTGGGG GCCGAAGCCG AAGGTCGAGC GCCTCATCTA CGCGATCACG 
CCCGATCCGT CGGTGCGCGC GCAGAAGGTG AAGGCGGGCG AATGCCAGAT CGCGCTGTCG 
CCGAAGCCGC AGGACGTCGC GGCCGCGAAG GCCGACCGCG CGCTGAGGGT CGTCGAGACG 
CCCGCGTTCA TGACCGCGTT CGTCGCGCTC AACACGCAGA AGAAACCGCT CGACAACGAC 
AAGGTTCGCG AGGCGCTCAA TCTCGCGTTC GATCGCGCGA CGTACCTGAA GGTCGTGTTC 
GACAACACGG CGACGCCCGC GACGAATCCG TATCCGCCGA ACACGTGGAG CTACGCGAAA 
TCGATCGCGC CGTATCCGCA CGATCCGGCG AAGGCGAAGC AGTTGCTCGC GCAGGCGGGC 
TTCCCGAACG GCTTCTCGAC GACGATCTGG GTGCGCCCGA CGGGCAGCGT GCTGAACCCG 
AACCCGAAGG CGGGCGCGGA GCTGCTGCAG GCCGACCTCG CGAAGATCGG CGTGAAGGCG 
GACGTGCGGG TGATCGAATG GGGCGAGCTG ATCAAGCAGG CGAAGCTCGG CCAGCACGAT 
CTGCTGTTCA TGGGCTTCGC CGGCGACAAC GGCGATCCGG ACAACATCCT CACGCCGCAA 
TTCAGTTGCA ACTCGGTGAA GTCGGGCCTG AACTTCGCGC GCTATTGCGA TCCGAAGCTC 
GACAAGCTGA TCGCCGACGC AAAGGAAACC GCCGATCAAG CCAAGCGCGC GAAGCTGTAC 
GAGGCCGCGC AGAAGATCAT CCACGACGAG GCGCTGTGGA TTCCCCTCGG CTATCCGACC 
GCCGCGGCGA TTACCCGGCC GAACGTCGCC GGCTATCGCG TGAGCCCGTT CGGGCGGCAG 
CACTTCGACG CGGTCTCGGT GCAGTAA

Protein sequence

MRFTHIAAAA LVAAASVAAA KPLTVCTESS PDGFDVVQYN SLVTTNASAD VVFNTLVSYD 
EATKKVVPAL ADKWDVSADG LAYTFHLRPN VAFQTTDSFK PTRALDADDV VFTFGRMLDD 
ANPWHKVAGA SGFPHAQSMG LAKLVKAVTK IDESTVKFEL NEPNATFVPI LTMGFASIYS 
AEYADQLLKA GKQADLNAKP VGTGPFVLKS YTKDAVIRYE ANPTYWGPKP KVERLIYAIT 
PDPSVRAQKV KAGECQIALS PKPQDVAAAK ADRALRVVET PAFMTAFVAL NTQKKPLDND 
KVREALNLAF DRATYLKVVF DNTATPATNP YPPNTWSYAK SIAPYPHDPA KAKQLLAQAG 
FPNGFSTTIW VRPTGSVLNP NPKAGAELLQ ADLAKIGVKA DVRVIEWGEL IKQAKLGQHD 
LLFMGFAGDN GDPDNILTPQ FSCNSVKSGL NFARYCDPKL DKLIADAKET ADQAKRAKLY 
EAAQKIIHDE ALWIPLGYPT AAAITRPNVA GYRVSPFGRQ HFDAVSVQ