Gene BURPS1106A_3134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3134
Symbol
ID	4901346
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3055999
End bp	3057069
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	61%
IMG OID	640136360
Product	NAD-dependent epimerase/dehydratase family protein
Protein accession	YP_001067372
Protein GI	126453040
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.983056
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGTTGACG GGAAAAAGAT CCTCGTGACC GGTGGGGCTG GCTTTATCGG CTGCGCGATA 
TCGGAGCGAC TCGCAGCGCG TGCAAGCCGC TACGTCGTAA TGGACAACTT GCATCCGCAG 
ATCCATGCGA GCGCGGTTCG TCCTGGCGCG CTTCACGAGA AAGCGGAACT CGTCGTTGCC 
GACGTCACGG ACGCCGGTGC ATGGGATGCG CTGCTGAGCG ATTTTCAACC GGAAATCATC 
ATACATCTGG CCGCCGAAAC GGGCACGGGC CAATCGCTGA CGGAAGCGAG TCGGCATGCG 
CTCGTCAACG TCGTCGGCAC CACGCGGCTG ACGGACGCGC TCGTCAAGCA CGGCATCGTG 
GTCGAGCACA TTCTGCTGAC GAGCAGCCGC GCGGTCTATG GCGAAGGGGC ATGGCAGAAG 
GACGATGGCA CGATCGTTTA TCCCGGCCAA CGCGGGCGCG CCCAGCTCGA GGCTGCGCAA 
TGGGATTTCC CGGGGATGAC GATGCTGCCT TCGCGTGCGG ACCGTACCGA GCCGCGGCCG 
ACGAGCGTCT ATGGTGCAAC GAAGCTCGCG CAGGAACACG TACTGCGTGC ATGGTCGCTC 
GCAACGAAAA CGCCGCTGTC GATTTTGCGT CTGCAGAACG TTTATGGCCC GGGTCAATCG 
TTGACTAACT CCTATACCGG CATCGTCGCG CTTTTCTCTC GGCTTGCTCG CGAAAAGAAG 
GTGATTCCGC TCTATGAAGA CGGCAATGTG ACGCGCGATT TTGTCAGTAT CGACGATGTG 
GCGGACGCCA TTGTCGCGAC GTTGGTGCGC ACGCCGGAAG CACTCTCTCT TTTCGATATC 
GGCTCCGGAC AGGCGACGAG CATTCTCGAT ATGGCTCGAA TCATCGCGGC GCATTACGGC 
GCTCCCGAGC CGCAGATCAA CGGTGCATTC CGCGACGGAG ATGTACGACA CGCGGCGTGC 
GACTTGAGCG AATCGTTGGC GAACCTTGGA TGGAAGCCGC AGTGGTCGCT CAAACGCGGG 
ATCGGCGAAT TGCAGACCTG GATCGCGCAA GAGCTTGATC GCAAGAACTA G

Protein sequence

MVDGKKILVT GGAGFIGCAI SERLAARASR YVVMDNLHPQ IHASAVRPGA LHEKAELVVA 
DVTDAGAWDA LLSDFQPEII IHLAAETGTG QSLTEASRHA LVNVVGTTRL TDALVKHGIV 
VEHILLTSSR AVYGEGAWQK DDGTIVYPGQ RGRAQLEAAQ WDFPGMTMLP SRADRTEPRP 
TSVYGATKLA QEHVLRAWSL ATKTPLSILR LQNVYGPGQS LTNSYTGIVA LFSRLAREKK 
VIPLYEDGNV TRDFVSIDDV ADAIVATLVR TPEALSLFDI GSGQATSILD MARIIAAHYG 
APEPQINGAF RDGDVRHAAC DLSESLANLG WKPQWSLKRG IGELQTWIAQ ELDRKN