Gene BURPS1106A_0999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0999
Symbol
ID	4903007
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	978462
End bp	979541
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	72%
IMG OID	640134228
Product	NAD-dependent epimerase/dehydratase family protein
Protein accession	YP_001065279
Protein GI	126452148
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCAATGCG CGCACGGCGG CTACAATGCA TTCCTACGGA TCAACCGATA CATCATGATT 
GCGACACGAA TCCTGCGCCG GCCGCGCGTA TTGATCGTCG GCTGCGGCGA TGTCGGCACG 
CGCTGCGCCG CGCAACTGCG CGCGCGGCGC GAGAACCTGC GCATCCTCGC GCTGACGAGC 
CGGCGTTCGC GCTGCGTCGA GCTTCGGGCG GCGGGCGTCG TGCCCGTCGT CGGCGATCTG 
GATGCGCGCG CGACGCTTAA GCGGATCGCG CGCGTCGCGC CCGTCGTGCT GCATCTCGCG 
CCGCCGCAGG CCACGGGCGA CGTCGATCGC CGCACGCAGG CGCTCGTCGC CGCGCTCGCG 
TCGCCGCGGC GGCCGTCGCG TCAACTCGCG CCGGCATACG GCAGGCTGCG CGCGTGGCGG 
ACCGCCGCCA GATCGGCTCG GCCGCCTTTT CAGGCATCGG CTATTGTACC CGACGCCCTG 
CCGCGCCCCG TCGTCGTCTA TGCGAGCACG AGCGGCGTCT ATGGCGATTG CGGCGGCGCG 
CGGGTTGACG AAACGCGTGC GGTGCGGCCC GCGAATCCGC GCGCGCGGCG GCGCGTGTCG 
GCCGAGCGCC AGTTGCGCCG CGCGACCGCG CGCGGCGCGC TGTCCGCGCG CATCGTGCGG 
ATCCCCGGCA TCTACGCGGC GAACCGGCTG CCGCTCGCGC GGCTCGAGAA GGGGACGCCG 
GCCCTCGTCG AGGCCGACGA CGTCTATACG AACCATATCC ACGCCGACGA TCTCGCGTCG 
ATTCTGTTGC GCGCCGCCGT GCGCGGCAAG CCCGCGCGGG TCGTTCATGC GAGCGACGAC 
ACCGAGCTGA AGATGGGAGA TTACTTCGAG CGGGTGGCGC GCGCGTTCGG CCTGCGCAGC 
CCGCCGCGCA TCGCGCGCGC CGAGGCGGAG CGGCAGCTCG AGCCGATGCT GCTGTCGTTC 
ATGCGCGAAT CGCGGCGGCT CGCGAACGCG AGAATGAAGC GCGAATTGCG CATCGCGCTG 
CGTTACCCGA GCGTCGACGA CTTTCTGCGC ACCGTATCCG CGCCGCGTCC GCTCAAGTGA

Protein sequence

MQCAHGGYNA FLRINRYIMI ATRILRRPRV LIVGCGDVGT RCAAQLRARR ENLRILALTS 
RRSRCVELRA AGVVPVVGDL DARATLKRIA RVAPVVLHLA PPQATGDVDR RTQALVAALA 
SPRRPSRQLA PAYGRLRAWR TAARSARPPF QASAIVPDAL PRPVVVYAST SGVYGDCGGA 
RVDETRAVRP ANPRARRRVS AERQLRRATA RGALSARIVR IPGIYAANRL PLARLEKGTP 
ALVEADDVYT NHIHADDLAS ILLRAAVRGK PARVVHASDD TELKMGDYFE RVARAFGLRS 
PPRIARAEAE RQLEPMLLSF MRESRRLANA RMKRELRIAL RYPSVDDFLR TVSAPRPLK