Gene BURPS1106A_A1925 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1925
Symbol
ID	4906251
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1885311
End bp	1886282
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	72%
IMG OID	640145031
Product	NAD-dependent epimerase/dehydratase family protein
Protein accession	YP_001075959
Protein GI	126457337
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.281448
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGTTC TCATCACCGG CGGCGCCGGC TTTCTCGGCC AGCGTCTCGC GAAACAGCTG 
CTCGCGCGCG GCAAGCTGAC CGGCCCGAAC GGCGCGCCGC GGCGCATCGA CGAGCTCGTG 
CTGCTCGACG TCGTCCAGGC CCACGACTTC GATGATGCGC GCGTGACGGC GCGCGTCGGC 
GACATCGCCG ATCGCGCCGT GCTCGAGGCC GCGATCGACG CGCGCACGCA CGCGGTCTTC 
CATCTCGCGG CGATCGTGAG CGGCCAGGCG GAAGCCGATT TCGACCTCGG GATGCGGATC 
AACCTCGATG CGTCGCGCCT GTTGCTCGAC GTGTGCCGCG CGCGCGGGCA CCGGCCGCGC 
GTGGTGTTCA CGAGCTCGGT GGCGGTGTAC GGCGGCGCGC TGCCCGAACT CGTGCGGGAC 
GACACCGCGC TCGAACCGCA GTCGTCGTAC GGCGCGCAGA AGGCAATCGC CGAGTTGCTG 
CTGTCCGATT ACACGCGCCG CGGCTTCGTC GACGGGCGCG TGCTGCGGCT GCCGACGATC 
AGCGTGCGGC CGGGCCGGCC GAACGCGGCG GCTTCGTCGT TCGCGAGCGG GATCGTCCGC 
GAGCCGCTGA ACGGCGAGCA AGCCGTATGC CCGGTGCCGG GCGGCACGCG GCTGTGGCTG 
CTGTCGCCGC GCCGCGCGAT CGACGCGCTC ATCGCCGGCT GCGAGCTCGA CGGCGCGGCG 
CTCGGCAACC GGCGCACGAT CAACTTGCCG GGGCTCTCGG TGACGGTCGA CGACATGATC 
GACGCGCTGC GCGAAGTCGC CGGCATCGAA GCGGTGAAGC TGATCCGGCG CGCCGAGGAC 
GAGCGCGTCG TGAAGATCGT CGGCAGTTGG CCGGGACGCT GGGACACGTC GCGCGCCGAA 
GCGCTCGGCC TCGCGGGCGA CGCGAGCTTC GTCGACGTGA TCCGCGGCTA TCTCGAAGAC 
GAGCGGCGAT AA

Protein sequence

MKVLITGGAG FLGQRLAKQL LARGKLTGPN GAPRRIDELV LLDVVQAHDF DDARVTARVG 
DIADRAVLEA AIDARTHAVF HLAAIVSGQA EADFDLGMRI NLDASRLLLD VCRARGHRPR 
VVFTSSVAVY GGALPELVRD DTALEPQSSY GAQKAIAELL LSDYTRRGFV DGRVLRLPTI 
SVRPGRPNAA ASSFASGIVR EPLNGEQAVC PVPGGTRLWL LSPRRAIDAL IAGCELDGAA 
LGNRRTINLP GLSVTVDDMI DALREVAGIE AVKLIRRAED ERVVKIVGSW PGRWDTSRAE 
ALGLAGDASF VDVIRGYLED ERR