Gene BURPS668_A2556 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2556
Symbol	thrB
ID	4887885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2466138
End bp	2467133
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	69%
IMG OID	640132493
Product	homoserine kinase
Protein accession	YP_001063549
Protein GI	126444279
COG category	[R] General function prediction only
COG ID	[COG2334] Putative homoserine kinase type II (protein kinase fold)
TIGRFAM ID	[TIGR00938] homoserine kinase, Neisseria type

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCGTTT TCACCGCAGT TTCCGACGCT GACCTCGCAC TCTGGATGCG CCACTACGAT 
CTCGGCGACG TTGTCGCGTT CCGCGGCATT CCGTCCGGCA TCGAGAACAG CAACTTCTTC 
CTGACGACGA CGCGCGGCGA ATACGTGCTC ACGATCTTCG AGAACCTGAC GGCCGGGCAA 
TTGCCGTTCT ACGTCCATCT GATGAGCCAT CTCGCGAAGC ACGGGGTGCC CGTGCCCGCG 
CCCGTCGCGC GCGACGACGG CACGCTGTTC GGCGAGTTGC ACGGCAAGCC GGCCGCGATC 
GTCACCAAGC TCGAGGGCGC GGCGCAGCTC GCGCCGGGCG TCGAGCACTG CGTCGAAGTC 
GGGCAGATGC TCGCGCGCAT GCACCTCGCG GGCCGCGACT ATCCGCGGCA TCAGCCCAAC 
TTGCGCAGCC TGCCGTGGTG GCGCGACACG GTGCCCGCGA TCGCGCCGTT CGTCACGGGC 
GAGCAGCGCG CGCTGCTGGA AGGCGAGCTC GCGCACCAGG CCGCGTTCTT CGCATCGGAC 
GATTACGCGG CGCTGCCGGA AGGCCCGTGC CATTGCGACC TGTTTCGCGA CAATGCGCTC 
TTCGCGCACG CGGAGCCCGA CACCGGCCAT TCGGTGCGGC TCGGCGGCTT CTTCGATTTC 
TACTTCGCCG GCTGCGACAA ATGGCTGTTC GACGTCGCGG TGACGGTCAA CGACTGGTGC 
GTCGATCTGC CGACGGGCGC GCTCGACGCC GCGCGCGCCG ACGCGCTGCT GCGCGCGTAC 
CAGACGGTGC GCCCGTTCAC CGCGGGCGAG CGCCGCCACT GGGGCGACAT GCTGCGCGCG 
GGCGCGTACC GCTTCTGGGT ATCGCGCCTG TATGATTTCC ACCTTCCCCG CGCCGCGCAG 
ATGCTCAAGC CGCACGACCC GGGCCATTTC GAACGCATCC TGCGCGAACG CATCGCGCAC 
GCGGGCGCGC CCCCCGAGAC CCACGCATGC AACTGA

Protein sequence

MAVFTAVSDA DLALWMRHYD LGDVVAFRGI PSGIENSNFF LTTTRGEYVL TIFENLTAGQ 
LPFYVHLMSH LAKHGVPVPA PVARDDGTLF GELHGKPAAI VTKLEGAAQL APGVEHCVEV 
GQMLARMHLA GRDYPRHQPN LRSLPWWRDT VPAIAPFVTG EQRALLEGEL AHQAAFFASD 
DYAALPEGPC HCDLFRDNAL FAHAEPDTGH SVRLGGFFDF YFAGCDKWLF DVAVTVNDWC 
VDLPTGALDA ARADALLRAY QTVRPFTAGE RRHWGDMLRA GAYRFWVSRL YDFHLPRAAQ 
MLKPHDPGHF ERILRERIAH AGAPPETHAC N