Gene BURPS1106A_0589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0589
Symbol
ID	4902199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	556984
End bp	558804
Gene Length	1821 bp
Protein Length	606 aa
Translation table	11
GC content	69%
IMG OID	640133819
Product	TPR repeat-containing protein
Protein accession	YP_001064871
Protein GI	126452823
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG5010] Flp pilus assembly protein TadD, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0397506
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCTTGC CCTTGAAGCT GTCCCAGAAG CGCCTTGCCG CTGCGCGCGG CCCGCGCGCC 
GTTCCGGTGC GCCGCGCGAT CGGCGCCGCG CTCGTCGCGG CGTGGGCGCT CGCCGCGCTC 
CCCGCTCACG CGCAGGACGA CGCAGGCGAC GACGCCCCCC AGGCCGCGTT CGCGTCGGCG 
CTGCCGGAAG AGCAGAAGGA TCTGCCGAAC GTCGCGCTGA CGAGCCAGAT CGTCTACCAG 
GTGCTCGCGG CCGAGGTCGC GCTGCAACGC AGTCTTCCCG CGCCAGCCTA TCAGACCTAC 
CTCGCGCTCG CGCGCGACAC GCGCGATCCG CGGATGGCGC AGCGGGCGAC CGAGATCGCG 
CTCGCCGCGC AGAGCCCGGC GGACGCGCTG ACGGCCGCCA ATCTGTGGCG CGAATATTCG 
CCGGGTTCGC AGCGCGCCGC GCAGGTCGAC GCCGCGCTCC TCGTGCTCGG CGGCAAGCCG 
GCCGAAGCGC AGCCGATGCT CTCGCAAGAG CTCGCCCGCG CAACCGGCGA GAATCGCGGC 
CAGGCGATCA TCGCGCTGCA GGCGCTGCTC GCGCGCGGGC CGAACCGCGT CGGCGGCCTG 
ACGGTGCTCC AGGATCTGCT GAAGAACGAC ATGGGCCGGC CCGAGGCGCG GCTCGCGATC 
GCGCGCCAGC AACTCGCCAC CGACGACAAG GACGGCGCGA CGCAATCGCT GAAGGAAGCG 
CTGCGCATCA AGCCCGATTA TCTGCCGGCG GCGCTGATGC TGTCGCAGAT GGGCCCGGGC 
GAGCGCGCGG CCGGAATCGC GTCGTTCGAG AAGTTCGTCC AGCAGAATCC GAAATCGCGC 
GACGGCCGCC TCGCGCTCGC GCAACTGTAT CTCGCCGACG ATCGCCTCGA CGACGCGCAA 
AAGCAGTTCG ACGCGATGCG CCGCAACGAT TCGAGCGACC CGACGCCGCT GATGGCGATT 
GCGCTCATCA AGATCCAGCA GAAGCACCTC GACGACGCGA CGACGTACCT GAAGCAATAC 
GTGAAGGTCG CGCAGAAGAA GCCGGGCGCG GACGTCGGCC AGGCGTACGT GTATCTCGCG 
CAGATCGCGC TCGACCAGAA CAACGAGGCG CTCGCCGCGC AATGGCTCGA CAAGGTCGAC 
GAAGCGAGCC AGCAGTACGT ACCCGCGCAG GTCACGCGCG CGCAGTTGCT GCAGAAGCAG 
GGCAAGGCCG ACGAAGCGCG CAAGCTGCTC GCGAACCTGC AGGCGTCCGA CCCGCGCGAC 
GCCGCGGTGA TCGCGCGCAC CGACGCGTCG ATCCTCTTCA CGTCGAAGCG CTACAAGGAA 
GCCGCCGACC GGCTCGCGCA AGCCGTGGAG GATTTCCCGG ACGATCCCGA TCTGCGCTAC 
GACTACGCGA TGGCGAGCGA GAAGATCGGC CAGTACACGA CGATGGAACA GCAGTTGCGC 
CTGCTGATGC GTGCGCAGCC CGACAATCCG CAAGCCTACA ACGCGCTCGG CTATTCGCTC 
GCGGACCGCA ACCTGCGCCT GCAGGAAGCG AGCAAGCTGA TCGAGAAGGC GAACTCGCTC 
GCGCCGAACG ACGCGTTCAT CATGGACAGC CTCGGCTGGG TCAAGTATCG CCTCGGCGAC 
ACGGCGGGCG CGACGGCGAT CCTGAAACGC GCTTACGACC TGCAGCCGAA CGCGGAAATC 
GGCGCGCACC TGGGCGAAGT GCTGTGGAGA AGCGGCTCGC GCGACGAAGC GCGCGCCGCA 
TGGCGCGCGG CGCAGAAGCT CGAACCCGAC AACGATACGC TCGTGCAGAC GCTCAAGCGC 
CTTCAGGTGA ACGGACTTTG A

Protein sequence

MTLPLKLSQK RLAAARGPRA VPVRRAIGAA LVAAWALAAL PAHAQDDAGD DAPQAAFASA 
LPEEQKDLPN VALTSQIVYQ VLAAEVALQR SLPAPAYQTY LALARDTRDP RMAQRATEIA 
LAAQSPADAL TAANLWREYS PGSQRAAQVD AALLVLGGKP AEAQPMLSQE LARATGENRG 
QAIIALQALL ARGPNRVGGL TVLQDLLKND MGRPEARLAI ARQQLATDDK DGATQSLKEA 
LRIKPDYLPA ALMLSQMGPG ERAAGIASFE KFVQQNPKSR DGRLALAQLY LADDRLDDAQ 
KQFDAMRRND SSDPTPLMAI ALIKIQQKHL DDATTYLKQY VKVAQKKPGA DVGQAYVYLA 
QIALDQNNEA LAAQWLDKVD EASQQYVPAQ VTRAQLLQKQ GKADEARKLL ANLQASDPRD 
AAVIARTDAS ILFTSKRYKE AADRLAQAVE DFPDDPDLRY DYAMASEKIG QYTTMEQQLR 
LLMRAQPDNP QAYNALGYSL ADRNLRLQEA SKLIEKANSL APNDAFIMDS LGWVKYRLGD 
TAGATAILKR AYDLQPNAEI GAHLGEVLWR SGSRDEARAA WRAAQKLEPD NDTLVQTLKR 
LQVNGL