Gene BURPS1106A_2151 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2151
Symbol	tkrA
ID	4899438
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2135624
End bp	2136601
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	73%
IMG OID	640135381
Product	gluconate 2-dehydrogenase
Protein accession	YP_001066416
Protein GI	126455132
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism [R] General function prediction only
COG ID	[COG1052] Lactate dehydrogenase and related dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00341832
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCATC GCATCGTCGT CTACAAGCCG CTCCCCGACG ACGTGCTCGC GGCCTTGCGC 
GCGCGCGCCG ACGTCGTGCT CGCCGAGGGC GCCGACGCGC TCGCGCGCGC GCTGCCCGAC 
GCCGACGGCG CGCTCGGCGC GAGCCTGCGG ATCACGCCCG AGCTGCTTGA TCGCGCACCG 
CGGCTGCGCG CGTGGTCGAC GATCTCGGTC GGCTTCGACA ACTTCGACGT CGCCGATCTG 
ACGCGCCGCG GGATCGTGCT CGCGCACACG CCCGACGTGC TCACCGAGGC GACCGCCGAC 
ACCGTGTTCG CGCTGATCCT CGCGAGCGCG CGGCGCGTCG TGGAGCTCGC CGAATACGTG 
AAGGCGGGGC AGTGGCGCCA GAGCATCGGC GAGGCGCTGT ACGGCACCGA CGTGAACGGC 
AAGACGCTCG GCATCGTCGG GCTCGGGCGC ATCGGCACGG CGCTCGCGCG GCGCGCGGCG 
CTCGGCTTCC GGATGCCGGT GCTCTACACG AGCCGCAGCG CGCATCCGCA GGCCGAGGCG 
CAGTTCGGCG CGCGCCGCGT CGAGCTCGAC GAGCTGCTCG CCACGGCCGA TTTCGTGTGC 
CTGCAGGTGC CGCTTTCGCC GCAGACGCGG CACCTGATCG GCGCGCGCGA ACTCGCGAAG 
ATGAAGCGCG ACGCGATACT CGTGAACGCG TCGCGCGGGC CCGTCGTCGA CGAGGCGGCG 
TTAATCGACG CGCTGCGCGC GGGAGCGATC CGTGCGGCGG GGCTCGACGT GTTCGAGCAC 
GAGCCGCTCG CCGCGGATTC GCCGTTGCTG TCGATGCGCA ACGTCGTCGC GCTGCCGCAC 
ATCGGCTCGG CGACGCGCGA GACGCGCCAC GCGATGGCGC GCTGCGCGGC CGAGAACGTG 
ATCGCGGCGC TCGACGGCAC GCTCGCGCGC AATATCGTCA ATCGCGACGT GCTGCAGCGC 
ACGCCGTCGA CGCCGTGA

Protein sequence

MKHRIVVYKP LPDDVLAALR ARADVVLAEG ADALARALPD ADGALGASLR ITPELLDRAP 
RLRAWSTISV GFDNFDVADL TRRGIVLAHT PDVLTEATAD TVFALILASA RRVVELAEYV 
KAGQWRQSIG EALYGTDVNG KTLGIVGLGR IGTALARRAA LGFRMPVLYT SRSAHPQAEA 
QFGARRVELD ELLATADFVC LQVPLSPQTR HLIGARELAK MKRDAILVNA SRGPVVDEAA 
LIDALRAGAI RAAGLDVFEH EPLAADSPLL SMRNVVALPH IGSATRETRH AMARCAAENV 
IAALDGTLAR NIVNRDVLQR TPSTP