Gene BURPS1106A_A2135 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2135
Symbol	tauA
ID	4905094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2087911
End bp	2088921
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	70%
IMG OID	640145240
Product	taurine ABC transporter, periplasmic taurine-binding protein
Protein accession	YP_001076168
Protein GI	126457537
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4521] ABC-type taurine transport system, periplasmic component
TIGRFAM ID	[TIGR01729] taurine ABC transporter, periplasmic binding protein

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.611131
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTCTCA AGCGCATCCT CATCGCCGCG TCTTTCACCG CCGCCGCGGC CTCGGCCGTT 
CATTCGCACG CCGCCCGGGC GGAGACGGTG AACGTCGCCT ATCAGTACGG CGCCGATCCG 
GCGAAGCTCG CGCAGGCGGG CGCCGCGTAC GAGAAGGCCA CCGGCTGGAA GATCAACTGG 
CGCCGCTTCG ATTCGGGCGC GGATGTCGTC GCGGCGCTCG CCTCGGGCGA TGTCCAGCTC 
GGCGATGTCG GGCAGAGTCC GTTTACCGCG GCGGTGTCGC GCGGCGTGCC GATCCAGGCG 
GTCGCGCTGA ACGCGATCAC CGGCGTGTCC GAGGCGCTCG TCGTGCGCCG CGGCGCGCAT 
ATCGACAAGC CGGCCGATCT CGTCGGCAAG ACGATCGCGA CGCCTTACGC GTCGAACTGC 
CATTACGCGC TGCTCGCCGC GCTCAAGCAC TGGGGCATCG ATGCGCAGCG CGTGAAGATC 
GTGAATCTCG GGCCGACCGA GATCGTCGCC GCATGGGCGC GCGGCGTGAT CGACGCCGCC 
TATACGTGGG ACCCGGCGCT CGGCCGCGCG AAGGCGAGCG GCGGCAAGGT GCTCGTCGAT 
TCGGCCGAAG TCGGCAAGTG GGGCGCGCCG ACATTCGATC TGTGGGCGGT GCGCAGCGAT 
TTCGCGCAAG CGCATCCGGA TTTCGTGTCG AAGTTCGTGA AGGTGACGAC GCAGGCGATC 
GCCGACTATC GCGCGAACGG CAAGGCATGG ACGAGCGCGT CGCGGCAGGT CGCCGAAATC 
TCGCGGCTGA GCGGCGCGGC GGCGGGCGAC ATTGCGCAAC TGCTCGCCGG CAATCTCTAC 
CCGAGCGCGG CCGAGCAGGC GTCGCCCGAG CTGCTCGGCG GCGGCACGGC CGACGCGATC 
GCGTCGACCG CGCGCTTCCT GAAGGAGCAG CGCAAGATCG ACCGCGTGCT GCCCGATTAC 
CGGCCGACGG TGACGGACCG GTTCGTCCGC GCGGCGATCG CCGCGCGCTG A

Protein sequence

MILKRILIAA SFTAAAASAV HSHAARAETV NVAYQYGADP AKLAQAGAAY EKATGWKINW 
RRFDSGADVV AALASGDVQL GDVGQSPFTA AVSRGVPIQA VALNAITGVS EALVVRRGAH 
IDKPADLVGK TIATPYASNC HYALLAALKH WGIDAQRVKI VNLGPTEIVA AWARGVIDAA 
YTWDPALGRA KASGGKVLVD SAEVGKWGAP TFDLWAVRSD FAQAHPDFVS KFVKVTTQAI 
ADYRANGKAW TSASRQVAEI SRLSGAAAGD IAQLLAGNLY PSAAEQASPE LLGGGTADAI 
ASTARFLKEQ RKIDRVLPDY RPTVTDRFVR AAIAAR