Gene BURPS1106A_2921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2921
Symbol
ID	4901119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	2864020
End bp	2865138
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	70%
IMG OID	640136147
Product	L-sorbosone dehydrogenase
Protein accession	YP_001067166
Protein GI	126454497
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCCGCGCG CTGCGTCCGC CGCGTGTCTC GTTCTTGCCA CAATCGTCAC GGTCGCCACG 
GCCCCCGCCG CGTCGGCCGC ATTGCCGATC GACGAGCTCC GCGTGCCGCC CGGATTCCGG 
GTCCAGGTGC TCGCCGACGA CGTGCCCACC GCGCGCGAGA TGGCGTGGTC GCCGCGCGGC 
ATCCTCTACG TCGGCAGCAT GAACGGACGA GTGCACGCGC TCGTCGTGCG CGACGGCCAT 
GTCCGCGAAC ACCACGTGAT CGCGTCGGGG CTCGAGATGC CGGTCGGCGT CGCGTATCGC 
AGCGGCGCGC TCTTCGTGTC GGCCGTGTCG CGGATTTTAC GCCTCGACCG CATCGACGAG 
CGGCTCGCCG CGCCGCCGAA GCCCGTCGTC GTCACGAACG CGCTGCCGAC CGACCGCCAT 
CACGGCTGGA AGTTCATCGC GTTCGGCCCG GACGGCAAGC TCTACGTGCC CACGGGCGCG 
CCGTGCAATA TTTGCGTCGC CGACCGCGAC CGCTATGCGA TGATCGGCCG GATGAACGCC 
GACGGCAGCG GCTACGAGGT CTACGCGCGA GGCGTGCGCA ACACCGTCGG CTTCGCGTGG 
CACCCGGCGA CGCGCGAACT CTGGTTCACC GACAACGGCC GCGACCTGAT GGGCGACGAC 
CGTCCCGACG ACAAGCTCAA TCGCGCGCCG CGCGCGGGCC TCGACTTCGG CTATCCGTTC 
TGCCACGGCG GCGACGTGCT CGATCCGCAA TTCGGGCGCG GCCACACGTG CTCGAGCTAC 
GCGCCGCCCG TGCTCAAGCT GGGCGCGCAC GTCGCCGCGC TCGGCATGCG CTTCTATACG 
GGCGGCATGT TCCCGCCCGA ATACCGCGAC AATATCTTCA TCGCCGAGCA CGGCTCGTGG 
AACCGCAGCC GCAAGGTCGG CTATCGGGTC GTGCGCGTGA TCGCGTCGCC CGACGGCCGC 
GCCGCGCGCG AGGAAACGTT CGTCCACGGG TGGCTGCGGC CCGACGAAAG CGTATGGGGG 
CGCCCCGCCG ACGTGCTGCC GCTACCGGAC GGCTCGCTCC TCGTGAGCGA CGACTACGCG 
GGCGCCATCT ACCGAATCAC CTACGATGCG ACGCATTGA

Protein sequence

MPRAASAACL VLATIVTVAT APAASAALPI DELRVPPGFR VQVLADDVPT AREMAWSPRG 
ILYVGSMNGR VHALVVRDGH VREHHVIASG LEMPVGVAYR SGALFVSAVS RILRLDRIDE 
RLAAPPKPVV VTNALPTDRH HGWKFIAFGP DGKLYVPTGA PCNICVADRD RYAMIGRMNA 
DGSGYEVYAR GVRNTVGFAW HPATRELWFT DNGRDLMGDD RPDDKLNRAP RAGLDFGYPF 
CHGGDVLDPQ FGRGHTCSSY APPVLKLGAH VAALGMRFYT GGMFPPEYRD NIFIAEHGSW 
NRSRKVGYRV VRVIASPDGR AAREETFVHG WLRPDESVWG RPADVLPLPD GSLLVSDDYA 
GAIYRITYDA TH