Gene BURPS1106A_3240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3240
Symbol	tolA
ID	4900942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3151451
End bp	3152476
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	70%
IMG OID	640136466
Product	TolA protein
Protein accession	YP_001067478
Protein GI	126452064
COG category	[S] Function unknown
COG ID	[COG4487] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01352] TonB family C-terminal domain [TIGR02794] TolA protein

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.137391
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCCTC GCCAGTCGCG CACCGCCGCC TACCCGCCCC GGCCGCCGCG CGAGCGCGGC 
ACAGGCCGGG CGTTCCTGCT CGCCGCGCTG ATGCACGTGC TGCTCGCGCT TTTCCTGTAC 
CACGGCGTGC ACTGGCAGAA CAGCACGCCG GCCGGCGCGG AGGCCGAGCT GTGGACGTCG 
GTGCCTGACA CGTCGACGCC GCAACCGGCG CCGACGCCGC CCGTGAAAGT CGCGCCTCCC 
CCGCCGCCCG TGAAGAACGA GGAAGCGGAT ATCGCCCTGC AGCAGAAGCG GCGCGAGCAG 
CAGGCCGCGG CCGCCCGCGA GGCGCAGCTC GAGGAGCAGC GCCGGCAGCA GCAATTGAAG 
GCGCAGCAAC TCGCCGCGCA GCAGGCCGCT CAGCTCGCCG CGCAAAAGGC CGCCGAGCGC 
GAGAAGCAAA AGCAGGCGGA AAAGCTCAAG CAGCAGCAAC TCGCGGAACA GCAGCAACGC 
AAACTCGAAC AGCAGAAGCT CGAGCAACAA AAGCTCGAAC AACAGAAGAA GCAGGAACAG 
CTCGCCGCGC AAAAGAAGGC GGACGCCGAA AAGGCCGAGA AAGCCGAAAA GGCGGCGAAG 
GCCGCGGCGG CCGCCAAGGC GAACGCCGCC GCGAAGGCGA AGCTCGACAA GGAGCGTCAG 
GCGCGCCTCG CGCAGTTGCA AGGCATCGCG GGCGGCGGCT CGGGCGGCGG CGAAGGCCTC 
GCGAAGAGCG GCACGGGCAC GGGCTCGGGC GGCAACGCCG CGTCCCCGGG CTATGCGGAC 
AAGGTCCGCC GGCGCGTGAA GCCGAACATC GTGTGGGCGG GCGAGCGCGA CAGCCTCGTG 
ACCGTCGTCG CGATCCGCTG CACGCCGTCG GGCGACGTGC TCAGCACGTC GATCCGCCGG 
TCCAGCGGAA ATTCGGGGTG GGATCAGGCG GTCATCAGCG CGATCCAGGC GTCGGTGCCC 
CTGCCGCCCG ATACCAACGG CCGCACTCCG TCCGAGATTA CGATTACCTT CAAGGCGGCG 
GAGTGA

Protein sequence

MKPRQSRTAA YPPRPPRERG TGRAFLLAAL MHVLLALFLY HGVHWQNSTP AGAEAELWTS 
VPDTSTPQPA PTPPVKVAPP PPPVKNEEAD IALQQKRREQ QAAAAREAQL EEQRRQQQLK 
AQQLAAQQAA QLAAQKAAER EKQKQAEKLK QQQLAEQQQR KLEQQKLEQQ KLEQQKKQEQ 
LAAQKKADAE KAEKAEKAAK AAAAAKANAA AKAKLDKERQ ARLAQLQGIA GGGSGGGEGL 
AKSGTGTGSG GNAASPGYAD KVRRRVKPNI VWAGERDSLV TVVAIRCTPS GDVLSTSIRR 
SSGNSGWDQA VISAIQASVP LPPDTNGRTP SEITITFKAA E