Gene BURPS1106A_2278 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2278
Symbol
ID	4901919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2263797
End bp	2264822
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	62%
IMG OID	640135507
Product	NAD-dependent epimerase/dehydratase family protein
Protein accession	YP_001066542
Protein GI	126452402
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.617261
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACGGCT TCATCGGTCA TCACCTGTCC AAGCGCATTC TTGAAACCAC CGATTGGGAA 
GTGTTCGGCA TGGACATGCA GACCGACCGG CTCGGCGATC TCGTCAAGCA CGAGCGGATG 
CATTTCTTCG AAGGCGACAT CACGATCAAC AAGGAGTGGG TCGAGTATCA CGTGAAGAAG 
TGCGACGTGA TCCTGCCGCT CGTCGCGATC GCGACGCCCG CCACCTACGT CAAACAGCCG 
CTGCGCGTGT TCGAGCTCGA CTTCGAGGCG AACCTGCCGA TCGTGCGCTC GGCCGTCAAG 
TACGGCAAGC ATCTCGTGTT TCCGTCGACG TCCGAGGTCT ATGGCATGTG CGCGGACGAG 
CAGTTCGACC CGGATGCGTC CGCCCTCACC TACGGCCCGA TCAACAAGCC GCGCTGGATC 
TACGCGTGCT CGAAGCAACT GATGGACCGC GTGATCTGGG GCTACGGGAT GGAAGGCCTG 
AACTTCACGC TGTTCCGCCC GTTCAACTGG ATCGGCCCGG GCCTCGACTC GATCTACACG 
CCGAAGGAAG GCAGCTCGCG CGTCGTCACG CAGTTCCTCG GCCACATCGT GCGCGGCGAG 
AACATCAGCC TCGTCGACGG CGGCTCGCAA AAGCGCGCGT TCACGTACGT CGACGACGGC 
ATCAGCGCAC TGATGAAGAT CATCGAGAAT TCGAACGGCG TCGCGACGGG CAAGATCTAC 
AACATCGGGA ATCCGAACAA TAACTTCTCG GTGCGCGAAC TCGCGAACAA GATGCTCGAG 
CTCGCGGCGG AGTTCCCCGA GTACGCCGAT TCGGCCAAGC GCGTGAAGCT CGTCGAGACG 
ACCTCGGGCG CGTACTACGG CAACGGCTAT CAAGACGTGC AGAACCGCGT GCCGAAGATC 
GAGAACACGA TGCAGGAGCT CGGCTGGGCA CCGCAGTTCA CGTTCGACGA CGCGCTGCGC 
CAGATCTTCG AGGCGTACCG CGGCCACGTC GCCGACGCGC GCGCGCTCGT CGAGCAGCAC 
GGCTGA

Protein sequence

MNGFIGHHLS KRILETTDWE VFGMDMQTDR LGDLVKHERM HFFEGDITIN KEWVEYHVKK 
CDVILPLVAI ATPATYVKQP LRVFELDFEA NLPIVRSAVK YGKHLVFPST SEVYGMCADE 
QFDPDASALT YGPINKPRWI YACSKQLMDR VIWGYGMEGL NFTLFRPFNW IGPGLDSIYT 
PKEGSSRVVT QFLGHIVRGE NISLVDGGSQ KRAFTYVDDG ISALMKIIEN SNGVATGKIY 
NIGNPNNNFS VRELANKMLE LAAEFPEYAD SAKRVKLVET TSGAYYGNGY QDVQNRVPKI 
ENTMQELGWA PQFTFDDALR QIFEAYRGHV ADARALVEQH G