Gene BURPS1710b_3475 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_3475
Symbol	thiL
ID	3691613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	3792706
End bp	3793707
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	74%
IMG OID	637729930
Product	thiamine monophosphate kinase
Protein accession	YP_334846
Protein GI	76809325
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCCATC CTCCCCTTTC GGAATTCTCG TTGATCGACC GCTTCTTCGC GCGCCGCGCG 
ACGGGGCCGC ACGCGCGCGC CGCGCTCGGC ATCGGCGACG ATTGCGCGCT GCTTGCACCA 
GAACCGGGCA AGCTGCTGGC GGTTTCGACG GACATGCTGG TCGAAGGCCG GCACTTCCTC 
GCCGATGTCG ATCCGCGCGC GCTCGGCCAC AAGACGCTCG CCGTCAATTT GTCCGATCTC 
GCCGCGATGG GCGCCGCGCC GCGCGCGTTC ACGCTCGCGT GCGCGCTGCC GCGCGCCGAC 
GCCGACTGGC TCGAGGCGTT TTCCGACGGC CTTTTCGCGC TCGCGGAGCG CCACGGCTGC 
GAGCTGATCG GCGGCGACAC GACGAGCGGG CCGCTCAACC TGTGCGTCAC GGTGTTCGGC 
GACGTCGCGT GCGGCGCCGC GTTGCGTCGA GACGCCGCAC GCGACGGCGA CGACGTCTGG 
GTATCCGGCA CGCTCGGCGA TGCGCGCGCC GGCCTCGGCG TGATCCGCGG CGAATGGCGC 
GCGGGCGAGC GCGAGGCGGC GGCGTTCCGG CGCGCGCTCG AATGGCCGCA ACCGCGCGTC 
GCGCTCGGCG TCGCGCTCGC GGGCATCGCG CACGCGGCGC TCGACGTGTC CGACGGCCTC 
GCGGGCGATC TGCCGCACAT CCTCGAGCGC TCGAACGTGC GCGCCGACGT GGACGTCGAC 
GCGGTGCCGC GCTCGGCCGC GCTCGCGACC CTGCCCGCCG ACGTGCAGCG CCGCTGCATG 
CTCGAAGGCG GCGACGACTA CGAGCTGTGC TTCACCGCCG CGCCGTCCGC GCGCACCGCG 
ATCGACGCGG CCGGCGCACG CGCGGGCGTG GCCGTCACGC GCATCGGTAC AATACGCGGC 
TTGTCCGCGC CGACGGACGC GCGCGCCGTG ACGTGGCGCG ACGCGTCGGG CGCGCCGCTT 
TCCCTCACGC TGCACGGTTT CGATCATTTC CATGCCAACT GA

Protein sequence

MAHPPLSEFS LIDRFFARRA TGPHARAALG IGDDCALLAP EPGKLLAVST DMLVEGRHFL 
ADVDPRALGH KTLAVNLSDL AAMGAAPRAF TLACALPRAD ADWLEAFSDG LFALAERHGC 
ELIGGDTTSG PLNLCVTVFG DVACGAALRR DAARDGDDVW VSGTLGDARA GLGVIRGEWR 
AGEREAAAFR RALEWPQPRV ALGVALAGIA HAALDVSDGL AGDLPHILER SNVRADVDVD 
AVPRSAALAT LPADVQRRCM LEGGDDYELC FTAAPSARTA IDAAGARAGV AVTRIGTIRG 
LSAPTDARAV TWRDASGAPL SLTLHGFDHF HAN