Gene BURPS1710b_A0962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A0962
Symbol	dehII
ID	3694456
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	-
Start bp	1223109
End bp	1224059
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	72%
IMG OID	637731216
Product	haloacid dehalogenase, type II
Protein accession	YP_336120
Protein GI	76818958
COG category	[R] General function prediction only
COG ID	[COG1011] Predicted hydrolase (HAD superfamily)
TIGRFAM ID	[TIGR01428] 2-haloalkanoic acid dehalogenase, type II [TIGR01493] Haloacid dehalogenase superfamily, subfamily IA, variant 2 with 3rd motif like haloacid dehalogenase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGGACG GCAGAGGTGC GTTTCTTTCG GACGTGCAGG CGCGGCGGTT CGCGCGTGGC 
GGATCGTACG GGGCGGTCCT GCGTGCGTCG CCCAGGCGCG CGCCGCCGGC CGGCGCGCGG 
CTCGCCGCGG CGTTCGGCCG GGCGCGCGCG TTCGGCGTCG GGCCGGTGCG AGCCGCCGAC 
GGCGGCCGCT GCATCCTGAA ACGTCATCCC ACGACTCAGG AGAACATCAT GCAGACGCTT 
GGCGTGAAGG CATTGGTATT CGACGTGTTC GGCACCGTGG TCGACTGGCG TTCCGGCGTC 
ATTCGCGACG CGACGCCGTT CCTCGCGAAG TACGGCGGCG CGGGAGCCGA TCCGGCCGCG 
TTCGCGGATG CGTGGCGCGC GGGCTATTCG CCCGCGATGG AGGAGGTGCG CAGCGGCCGC 
CGGCCGTTCA CGCGGCTCGA CGTGCTGCAC CGGGAGAATC TCGACGCGCT GCTGCCCGCG 
TTCGGCATCG ATCGCGCGAG CGTGGCCGAC GCCGATCTCG ACGCGCTGAA CCTCGCATGG 
CACCGGCTCG ATCCGTGGCC CGATTCGGTC GCGGGGCTCA CGCGGCTGAA GGCGCATTAC 
ATCATCGCGC CGCTGTCGAA CGGCAACGTG ATCCTGATGA TCGACATGGC CAAGCGCGCG 
GGGCTGCCGT GGGACGCGAT CCTCGGCGCC GAAGTGGCGC AGGCGTACAA GCCGACGCCC 
GAAGCGTACC TGCGCACGGC CGATATCCTC GCGCTGCGTC CGGATGAGGT GTGCCTCGTC 
GCCGCGCACA ACGGCGACCT CGCGGCCGCG CGGCGCTGCG GCTATCGCAC CGCGTTCGTC 
GCGCGAGCGC GCGAGCATGG TCCCGCGCAG ACCACCGATC TGCGCGCGGA GCAGGATTGG 
GACGTCGTCG CGGCCGATTT CATCGAGCTC GCGCAGCGCT TCGGCGCGTG A

Protein sequence

MSDGRGAFLS DVQARRFARG GSYGAVLRAS PRRAPPAGAR LAAAFGRARA FGVGPVRAAD 
GGRCILKRHP TTQENIMQTL GVKALVFDVF GTVVDWRSGV IRDATPFLAK YGGAGADPAA 
FADAWRAGYS PAMEEVRSGR RPFTRLDVLH RENLDALLPA FGIDRASVAD ADLDALNLAW 
HRLDPWPDSV AGLTRLKAHY IIAPLSNGNV ILMIDMAKRA GLPWDAILGA EVAQAYKPTP 
EAYLRTADIL ALRPDEVCLV AAHNGDLAAA RRCGYRTAFV ARAREHGPAQ TTDLRAEQDW 
DVVAADFIEL AQRFGA