Gene BURPS1106A_A2536 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2536
Symbol	dehII
ID	4904916
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	2493464
End bp	2494498
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	71%
IMG OID	640145639
Product	haloacid dehalogenase, type II
Protein accession	YP_001076566
Protein GI	126456413
COG category	[R] General function prediction only
COG ID	[COG1011] Predicted hydrolase (HAD superfamily)
TIGRFAM ID	[TIGR01428] 2-haloalkanoic acid dehalogenase, type II [TIGR01493] Haloacid dehalogenase superfamily, subfamily IA, variant 2 with 3rd motif like haloacid dehalogenase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.762748
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTGCTTGC GTGCCCGTGC GCTCGTGCGC GATGAAGCCG GCCTCTATTT CTCGCCGGGC 
ATGCAGGCAG GCGGTTCGCC GATAATGTCG GACGGCAGAG GTGCGTTTCT TTCGGACGTG 
CAGGCGCGGC GGTCCGCGCG TGGCGGATCG TACGGGGCGG TCCTGCGTGC GTCGCCCAGG 
CGCGCGCCGC CGGCCGGCGC GCGGCTCGCC GCGGCGTTCG GCCGGGCGCG CGCGTTCGGC 
GTCGGGCCGG TGCGAGCCGC CGACGGCGGC CGCTGCATCC TGAAACGTCA TCCCACGACT 
CAGGAGAACA TCATGCAGAC GCTTGGCGTG AAGGCATTGG TATTCGACGT GTTCGGCACC 
GTGGTCGACT GGCGTTCCGG CGTCATTCGC GACGCGACGC CGTTCCTCGC GAAGTACGGC 
GGCGCGGGAG CCGATCCGGC CGCGTTCGCG GATGCGTGGC GCGCGGGCTA TTCGCCCGCG 
ATGGAGGAGG TGCGCAGCGG CCGCCGGCCG TTCACGCGGC TCGACGTGCT GCACCGGGAG 
AATCTCGACG CGCTGCTGCC CGCGTTCGGC ATCGATCGCG CGAGCGTGGC CGACGCCGAT 
CTCGACGCGC TGAACCTCGC ATGGCACCGG CTCGATCCGT GGCCCGATTC GGTCGCGGGG 
CTCACGCGGC TGAAGGCGCA TTACATCATC GCGCCGCTGT CGAACGGCAA CGTGATCCTG 
ATGATCGACA TGGCCAAGCG CGCGGGGCTG CCGTGGGACG CGATCCTCGG CGCCGAAGTG 
GCGCAGGCGT ACAAGCCGAC GCCCGAAGCG TACCTGCGCA CGGCCGATAT CCTCGCGCTG 
CGTCCGGATG AGGTGTGCCT CGTCGCCGCG CACAACGGCG ACCTCGCGGC CGCGCGGCGC 
TGCGGCTATC GCACCGCGTT CGTCGCGCGA GCGCGCGAGC ATGGTCCCGC GCAGACCACC 
GATCTGCGCG CGGAGCAGGA TTGGGACGTC GTCGCGGCCG ATTTCATCGA GCTCGCGCAG 
CGCTTCGGCG CGTGA

Protein sequence

MCLRARALVR DEAGLYFSPG MQAGGSPIMS DGRGAFLSDV QARRSARGGS YGAVLRASPR 
RAPPAGARLA AAFGRARAFG VGPVRAADGG RCILKRHPTT QENIMQTLGV KALVFDVFGT 
VVDWRSGVIR DATPFLAKYG GAGADPAAFA DAWRAGYSPA MEEVRSGRRP FTRLDVLHRE 
NLDALLPAFG IDRASVADAD LDALNLAWHR LDPWPDSVAG LTRLKAHYII APLSNGNVIL 
MIDMAKRAGL PWDAILGAEV AQAYKPTPEA YLRTADILAL RPDEVCLVAA HNGDLAAARR 
CGYRTAFVAR AREHGPAQTT DLRAEQDWDV VAADFIELAQ RFGA