Gene BURPS1106A_3736 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3736
Symbol	thiE
ID	4900941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3646165
End bp	3647268
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	75%
IMG OID	640136962
Product	thiamine-phosphate pyrophosphorylase
Protein accession	YP_001067966
Protein GI	126453292
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0352] Thiamine monophosphate synthase
TIGRFAM ID	[TIGR00693] thiamine-phosphate pyrophosphorylase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGCCG CGTTGCCCGA CGCGTTCTGG CCGCCCGCCG ACGAGCTTAC CGAGGCCGCC 
GAGCGGATTC GCGCGACGCT CGGTGCGTGG CCGCAGCCGG CCGTGCGCAC GCGGATCTGT 
CTCGCGCCGC CCGAGCAGCC GCGCGCGGCC GACCTGTGGG TCGCCATCGC GGGCGACGCC 
GGCGCGCACG CCGCGCAGAT CGCGCGGCTG AACGCGGCGG GCGCGCAGGC GATCGTCATC 
GACGATGCAT CGGCGACGCT CCACACGGGC GCGGCGCGCC ATGCGCTCGC GTCGCGCGCG 
CCGCTCGCCG ACGACTGGAT CGCGGCGCTC GCGGCGTTTC TCGATTGCGG CTTCGCCGCG 
TCCGACGCAC TCGTGCTCGC GCTCGCATGG CGCGACGGCG ACGAGGCGCG CGGCGGCGAT 
CCGTGGCCCG TCGATCCGGC ACGCTTTCCG CGCGTGCTCG GCCTGCCCGC CGCGCCCGAA 
CCGGCGTTCG CGCCGTGCCC GCAGCGGCTC GGCCTGTATC CGGTGCTGCC GAGTGCCGAA 
TGGGTCGAGC GCGTGCTCGA TTGCGGCGTG CGGACCGTGC AACTGCGCGT GAAGGACGCC 
TCGCCCGACG CGCTGCGCGC GGAGGTCGAG CGGGCCGTTG CCGCGGGCCG CCGCCATCCG 
GACGCGCGCG TGTTCATCAA CGATCACTGG CGGCTCGCGC TCGACGCGGG CGCATACGGC 
GTGCACCTCG GCCAGGAGGA TCTGGAGACC GCCGATCTCG GCGCGATCGC GCGGGCGGGC 
GCGCGGCTCG GCCTGTCGAG CCACGGGTAT TACGAAATGC TCGTCGCGCT GCAGTTCAAG 
CCGAGCTATC TCGCGCTCGG CCCGGTGTTC GCGACCGCGA CGAAGGCGGT TGCCGCGCCG 
CCGCAAGGCC TCGCGCGGCT TGCGCGCTAC GTGCGCTTCG CCGGGCCGCA GGCGCCGCTC 
GTCGCGATCG GCGGAATCGC GCCCGACACG CTCGGCGCGG TGCTGGCGGC GGGCGTCGGC 
AGCGCGGCCG TCGTCAGCGC GATCACGGCG GCGACCGATT ACCGGGAAGC GATTGTTGCA 
TTGCAGCAAA ACTTCGGACG ATAA

Protein sequence

MSAALPDAFW PPADELTEAA ERIRATLGAW PQPAVRTRIC LAPPEQPRAA DLWVAIAGDA 
GAHAAQIARL NAAGAQAIVI DDASATLHTG AARHALASRA PLADDWIAAL AAFLDCGFAA 
SDALVLALAW RDGDEARGGD PWPVDPARFP RVLGLPAAPE PAFAPCPQRL GLYPVLPSAE 
WVERVLDCGV RTVQLRVKDA SPDALRAEVE RAVAAGRRHP DARVFINDHW RLALDAGAYG 
VHLGQEDLET ADLGAIARAG ARLGLSSHGY YEMLVALQFK PSYLALGPVF ATATKAVAAP 
PQGLARLARY VRFAGPQAPL VAIGGIAPDT LGAVLAAGVG SAAVVSAITA ATDYREAIVA 
LQQNFGR