Gene BURPS1106A_3477 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3477
Symbol	thiL
ID	4903078
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3383489
End bp	3384490
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	74%
IMG OID	640136703
Product	thiamine monophosphate kinase
Protein accession	YP_001067714
Protein GI	126452891
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0611] Thiamine monophosphate kinase
TIGRFAM ID	[TIGR01379] thiamine-monophosphate kinase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.695085
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCCATC CTCCCCTTTC GGAATTTTCG TTGATCGACC GCTTCTTCGC GCGCCGCGCG 
ACGGGGCCGC ACGCGCGCGC CGCGCTCGGC ATCGGCGACG ATTGCGCGCT GCTTGCACCA 
GAACCGGGCA AGCTGCTGGC GGTTTCGACG GACATGCTGG TCGAAGGCCG GCACTTCCTC 
GCCGATGTCG ATCCGCGCGC GCTCGGCCAC AAGACGCTCG CCGTCAATTT GTCCGATCTC 
GCCGCGATGG GCGCCGCGCC GCGCGCGTTC ACGCTCGCGT GCGCGCTGCC GCGCGCCGAC 
GCCGACTGGC TCGAGGCGTT TTCCGACGGC CTTTTCGCGC TCGCGGAGCG CCACGGCTGC 
GAGCTGATCG GCGGCGACAC GACGAGCGGG CCGCTCAACC TGTGCGTCAC GGTGTTCGGC 
GACGTCGCGT GCGGCGCCGC GTTGCGTCGA GACGCCGCAC GCGACGGCGA CGACGTCTGG 
GTATCCGGCA CGCTCGGCGA TGCGCGCGCC GGCCTCGGCG TGATCCGCGG CGAATGGCGC 
GCGGGCGAGC GCGAGGCGGC GGCGTTCCGG CGCGCGCTCG AATGGCCGCA ACCGCGCGTC 
GCGCTCGGCG TCGCGCTCGC GGGCATCGCG CACGCGGCGC TCGACGTGTC CGACGGCCTC 
GCGGGCGATC TGCCGCACAT CCTCGAGCGC TCGAACGTGC GCGCCGACGT GGACGTCGAC 
GCGGTGCCGC GCTCGGCCGC GCTCGCGACC CTGCCCGCCG ACGTGCAGCG CCGCTGCATG 
CTCGAAGGCG GCGACGACTA CGAGCTGTGC TTCACCGCCG CGCCGTCCGC GCGCACCGCG 
ATCGACGCGG CCGGCGCGCG CGCGGGCGTG GCCGTCACGC GCATCGGTAC AATACGCGGC 
TTGTCCGCGC CGACGGACGC GCGCGCCGTG ACGTGGCGCG ACGCGTCGGG CGCGCCGCTT 
TCCCTCACGC TGCACGGTTT CGATCATTTC CATGCCAACT GA

Protein sequence

MAHPPLSEFS LIDRFFARRA TGPHARAALG IGDDCALLAP EPGKLLAVST DMLVEGRHFL 
ADVDPRALGH KTLAVNLSDL AAMGAAPRAF TLACALPRAD ADWLEAFSDG LFALAERHGC 
ELIGGDTTSG PLNLCVTVFG DVACGAALRR DAARDGDDVW VSGTLGDARA GLGVIRGEWR 
AGEREAAAFR RALEWPQPRV ALGVALAGIA HAALDVSDGL AGDLPHILER SNVRADVDVD 
AVPRSAALAT LPADVQRRCM LEGGDDYELC FTAAPSARTA IDAAGARAGV AVTRIGTIRG 
LSAPTDARAV TWRDASGAPL SLTLHGFDHF HAN