Gene BURPS668_3202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3202
Symbol	tolA
ID	4885165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	3135142
End bp	3136167
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	70%
IMG OID	640129130
Product	TolA protein
Protein accession	YP_001060214
Protein GI	126438620
COG category	[S] Function unknown
COG ID	[COG4487] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01352] TonB family C-terminal domain [TIGR02794] TolA protein

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCCTC GCCAGTCGCG CACCGCCGCC TACCCGCCCC GGCCGCCGCG CGAGCGCGGC 
ACAGGCCGGG CGTTCCTGCT CGCCGCGCTG ATGCACGTGC TGCTCGCGCT TTTCCTGTAC 
CACGGCGTGC ACTGGCAGAA CAGCACGCCG GCCGGCGCGG AGGCCGAGCT GTGGACGTCG 
GTGCCTGACA CGTCGACGCC GCAACCGGCG CCGACGCCGC CCGTGAAAGT CGCGCCTCCC 
CCGCCGCCCG TGAAGAACGA GGAAGCGGAT ATCGCCCTGC AGCAGAAGCG GCGCGAGCAG 
CAGGCCGCGG CCGCCCGCGA GGCGCAGCTC GAGGAGCAGC GCCGGCAGCA GCAATTGAAG 
GCGCAGCAAC TCGCCGCGCA GCAGGCCGCC CAGCTCGCCG CGCAAAAGGC CGCCGAGCGC 
GAGAAGCAAA AGCAGGCGGA AAAGCTCAAG CAGCAGCAAC TCGCGGAACA GCAGCAACGC 
AAACTCGAAC AGCAGAAGCT CGAGCAACAA AAGCTCGAAC AACAGAAGAA GCAGGAACAG 
CTCGCCGCGC AAAAGAAGGC GGACGCCGAA AAGGCCGAGA AAGCCGAAAA GGCGGCGAAG 
GCCGCGGCGG CCGCCAAGGC GAACGCCGCC GCGAAGGCGA AGCTCGACAA GGAGCGTCAG 
GCGCGCCTCG CGCAGTTGCA AGGCATCGCG GGCGGCGGCT CGGGCGGCGG CGAAGGCCTC 
GCGAAGAGCG GCACGGGCAC GGGCTCGGGC GGCAACGCCG CGTCCCCGGG CTATGCGGAC 
AAGGTCCGCC GGCGCGTGAA GCCGAACATC GTGTGGGCGG GTGAGCGCGA CAGCCTCGTG 
ACCGTCGTCG CGATCCGCTG CACGCCGTCG GGCGACGTGC TCAGCACGTC GATCCGCCGG 
TCCAGCGGAA ATTCGGGGTG GGATCAGGCG GTCATCAGCG CGATCCAGGC GTCGATGCCC 
CTGCCGCCCG ATACCAACGG CCGCACTCCG TCCGAGATTA CGATTACCTT CAAGGCGGCG 
GAGTGA

Protein sequence

MKPRQSRTAA YPPRPPRERG TGRAFLLAAL MHVLLALFLY HGVHWQNSTP AGAEAELWTS 
VPDTSTPQPA PTPPVKVAPP PPPVKNEEAD IALQQKRREQ QAAAAREAQL EEQRRQQQLK 
AQQLAAQQAA QLAAQKAAER EKQKQAEKLK QQQLAEQQQR KLEQQKLEQQ KLEQQKKQEQ 
LAAQKKADAE KAEKAEKAAK AAAAAKANAA AKAKLDKERQ ARLAQLQGIA GGGSGGGEGL 
AKSGTGTGSG GNAASPGYAD KVRRRVKPNI VWAGERDSLV TVVAIRCTPS GDVLSTSIRR 
SSGNSGWDQA VISAIQASMP LPPDTNGRTP SEITITFKAA E