Gene BURPS1106A_A3020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A3020
Symbol
ID	4904225
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2937985
End bp	2938842
Gene Length	858 bp
Protein Length	285 aa
Translation table	11
GC content	69%
IMG OID	640146123
Product	short chain dehydrogenase/reductase family oxidoreductase
Protein accession	YP_001077049
Protein GI	126458174
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACCG CTGAAGCTTC ATCGCCGCAA GGCCGCACGC CGCAACCGGG CCGCGAGCGC 
GAGATGGCGG CGAAGCCGCG CGACGAGGCC GCCGGCTACG TCGGCAGCGG CCGCCTCGAC 
GGCAAGGTCG CGCTCGTGAC GGGCGGCGAC AGCGGCATCG GGCGCGCGGT CGCGGTCGGC 
TTCGCGAAGG AAGGCGCGGA CGTCGCGATC GTCTATCTGA ACGAATCGGA CGACGCCGCG 
CACACGAAGC ACCTGATCGA GCAGACGGGC CGGCGCTGCG AGACGATCGC GCTCGACATC 
GGCGAGCGCG CGAACGCGCA CGTCGCGCTC AGGCGCGCCG TCGAGCGCTT CGGCCGCCTC 
GACGTGCTCG TGAACAACGC GGGCGAGCAG CACGTGCAGA CCGACATCGG GCAGATCAGC 
GAAGCGCAGC TCACGCACAC GTTTCGCACC AATATCTTCG CGATGTTCTT CTGCACGCAG 
GCGGCGCTCA CCCACATGAA GGCGGGCGCG CGCATCGTCA ACACGGCGTC CGTCACCGCG 
TACCACGGCA ATCCGGTGCT CATCGATTAC TCGGCGACGA AGGGCGCGAT CGTATCGTTC 
ACACGCTCGC TCGCGCTCAA TCTCGCGAGC CGCGGCATTC ACGTGAACGC GGTCGCGCCG 
GGGCCGATCT GGACGCCGTT GATCCAGTCG ACGTTCGACG ACGAGCAGCG CGCGCGCTTC 
GGCGCCAACG TGCCGCTCAA GCGGCCCGGC CAGCCGGACG AGCTGATCGG CTGTTACGTG 
CTGCTCGCGT CGGACGGCGC GGACTACATG ACGGGCCAGA CGCTGCACCC GAACGGCGGG 
ACGATCGTCA ACGGCTGA

Protein sequence

MSTAEASSPQ GRTPQPGRER EMAAKPRDEA AGYVGSGRLD GKVALVTGGD SGIGRAVAVG 
FAKEGADVAI VYLNESDDAA HTKHLIEQTG RRCETIALDI GERANAHVAL RRAVERFGRL 
DVLVNNAGEQ HVQTDIGQIS EAQLTHTFRT NIFAMFFCTQ AALTHMKAGA RIVNTASVTA 
YHGNPVLIDY SATKGAIVSF TRSLALNLAS RGIHVNAVAP GPIWTPLIQS TFDDEQRARF 
GANVPLKRPG QPDELIGCYV LLASDGADYM TGQTLHPNGG TIVNG