Gene BURPS1106A_1994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1994
Symbol
ID	4900183
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	1957113
End bp	1958333
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	76%
IMG OID	640135224
Product	amine ABC transporter, permease protein
Protein accession	YP_001066259
Protein GI	126455455
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1174] ABC-type proline/glycine betaine transport systems, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.455758
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCCGC GCACGGCGGG CGGCGCGGCC GCGCCCGCTC CCGCGCCGCG CCCGCGCGCG 
ATGCCCGCGT GGGCCGCGCG CGTCGACAAG GTCGGCGTGC TGATCGCCGC GCTCGTCGCG 
TACGCGGCGT TCGTGCTGCC GTTCGTCACG CTGCGCGCGA ACCGGATCGC GGCGGGCGCG 
GAGCTCGCGC CCGCCGCGGT GTTTCCGGCG CTCCACGCGT ACGCGCTCGA CGCGCTGTGG 
GCGGCGGGCG CGCTGTTCGC GCTCGTGCAC AGCCGCGCGG CATGGCGCGC GGCCGTCGGC 
GTCGGGCTCG TGTTCGCGCT GGGCGTGGCG ATCGGCGCGG CGCCCGCGCA TCTCGTCACG 
CCGGATACGC CGCTCGCGCG CGTGTCGCCC GCGGCGGGCG CGTGGCTGCT GCTGTTCGCG 
TTCGCGGTGC TGATCGCCGA CGCGCTCGCC CGGATCGCGC TCGCGCCCGC GATGCGCCTC 
GTCGCGCTCG CCGCGGCGAG CGCCGCGCTC GCGGCATTCA TTCACGGCGG CTTCTGGGAC 
GGGCTGTCGG TGATGCAGGA ATACGCGGTG CGCGCCGATA CGTTCCGCAA CGAGGCGATC 
CGGCATCTCG CGCTCGTCGC CGGCTCGGTG GCGGCGGCCG TCGCGCTCGG CGTGCCGCTC 
GGCATCGGCT GCACGCGCTC GGCCGCGCTG CGCGGCGCGT TGCTGCCGCT GCTGAACGTC 
GTGCAGACGA TCCCGAGCAT CGCGCTGTAC GGCCTGCTGA TGGCGCCGCT CGCGATCCTC 
GCCGCGCGCG TGCCGCTCGC CGCCCGCCTC GGCGTGAGCG GCATCGGCGT CGCGCCCGCG 
CTGATCGCCC TGTTCCTGTA TGCGCTGCTG CCGATCGTGT CGAGCGTCGT CGTCGGATTC 
GCGCAGGTGC CCGCCGCCGT CGTCGAGGCC GCGCTCGCGA TGGGGATGAC GGGCCGCGAG 
CGGCTCGTCG CGATCGAGCT GCCGCTCGCG CTGCCCGTCG TGCTTTCCGG CGTGCGCATC 
GTGCTCGTGC AGAACATCGG CCTCACGGCC GTCGCCGCGC TGATCGGCGG CGGCGGCTTC 
GGCACGTTCA TCTTCCAGGG GATCGGCCAG TCGGCGACCG ATCTCGTGCT GCTCGGCGCG 
CTGCCGACGA TCGCGCTCGC GCTCGTCACC GCCGTGCTGT TCGAGGCCGC GACCGACCTA 
GCGAAAGGAG CGCGCCGATG A

Protein sequence

MTPRTAGGAA APAPAPRPRA MPAWAARVDK VGVLIAALVA YAAFVLPFVT LRANRIAAGA 
ELAPAAVFPA LHAYALDALW AAGALFALVH SRAAWRAAVG VGLVFALGVA IGAAPAHLVT 
PDTPLARVSP AAGAWLLLFA FAVLIADALA RIALAPAMRL VALAAASAAL AAFIHGGFWD 
GLSVMQEYAV RADTFRNEAI RHLALVAGSV AAAVALGVPL GIGCTRSAAL RGALLPLLNV 
VQTIPSIALY GLLMAPLAIL AARVPLAARL GVSGIGVAPA LIALFLYALL PIVSSVVVGF 
AQVPAAVVEA ALAMGMTGRE RLVAIELPLA LPVVLSGVRI VLVQNIGLTA VAALIGGGGF 
GTFIFQGIGQ SATDLVLLGA LPTIALALVT AVLFEAATDL AKGARR