Gene BURPS1106A_3680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3680
Symbol
ID	4900504
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3593469
End bp	3596606
Gene Length	3138 bp
Protein Length	1045 aa
Translation table	11
GC content	63%
IMG OID	640136906
Product	SNF2-related:helicase, C-terminal
Protein accession	YP_001067911
Protein GI	126452260
COG category	[K] Transcription [L] Replication, recombination and repair
COG ID	[COG0553] Superfamily II DNA/RNA helicases, SNF2 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCGTCC AGAGCGAACG GCAAACTCAG GCATACCGAG CCCGACCAGC ACCGGGACAA 
CTGGTCGAAG TGCGCCGCCG TCAGTGGGTT GTTGCGGATA TCGATGCGGC AGGATTGAGC 
TTCGGACTTC CAACGCCCCA ACATTGCGTC ACGCTCTCAT CGATCGATGA AGACGGCCTT 
GGCGAGGAAT TGGAAGTCAT CTGGGAGATC GAGCCGGGAG CCCAAGTTAT CGAGCGGGCA 
GGTCTGCCTT CAATTACGGG GCAGGATGAT TCCGATGTGC TTGATGCCTT CCTTGATGCC 
GTGCGCTGGG GCGCGGCCAC CAACGCCGAC AGGGGGTTCC TCCAGGCTCC GTTCCGAAGT 
GGCGTCAGCA TCGAGGACTT TCAACTCGAT CCACTGGTCC GAGCCATCGA CATGGCTCGC 
GTCAATCTTC TTATTGCCGA CGATGTCGGC CTCGGCAAGA CCGTCGAGGC TGGTTTGGTC 
ATTCAGGAGT TACTGCTGCG GCATCGCGCC CGCACGGTAT TGATCGTTTG CCCGGCGTCG 
CTTCAGGAGA AGTGGCGCGT TGAGATGCTG GAGAAATTCG GACTCGATTT CCGCGTTGTC 
GATACTGACT ACATCAAGCG GTTGCGGCGC GAGCGTGGCA TCCATACCAA TCCATGGACG 
TCGCATCCGC GCCTCATCAC GTCTATGGAT TGGGCCAAGG GCGGAGAAGG CTTGCGGGCC 
ATGCGTGACG TGCTCCCGCC GCACGTCGGC CATCCGCGCA AGTTTGACCT GCTGGTCGTG 
GACGAAGCGC ACAACGTCGC GCCCTCGGCA GGCGCGCACT ACGCGCTGGA GAGTCAGCGT 
ACGCGCTTCG TCCGTGCCAT CGGCCCACAC TTCCAGCATC GTCTCTTCCT GACCGCGACG 
CCGCACAACG GCTACACCGA GTCGTTCACC TCGCTGCTGG AATTGCTCGA CGACCAGCGT 
TTCGCGCGCA ACATCCTCCC CGACGAAAAT CGTCTTAGTC AGGTGATGAT CCGCCGTCTG 
AAGAGCGATC TGGTTGATGC GGACGGCAAT CCCCTGTACG CCCGGCGCAC CTTGCAGGCA 
CTCGAAGTCC CATACACGGC GGAAGAGCGC GAGGTTCATC GCAAACTGGA CGATTACTGC 
GCGAGCCGTG AAAAGGATGC CGAGAACGCA GGCAACGGCT TTGGCACGGC CTTCGTCAAT 
CGTCTCCTCA AGAAACGTCT GCTCTCGTCG CCAGCGGCGT TCGCATCCAC GCTCGAAAAG 
CACGTCACGT CACTGTCAGA AGCGCGGCCC GCGAAGCTGG ACACGATGGC CGAACGCATC 
CTGCACAAGG CCATCCTGAA AGCCGACGAG GACTATGCCG ACGACGGGGA TGTCGAGAAC 
GCTCAAGCCG AAGCCGTCGA GGAAGCCACG CGCCGCTCAA TACCGCTGAC GCCAGAGCAG 
CGGGCGACGC TGGACGACTT GCGGGCATGG GCGCAGCGAG CCAGGAATCA GGCTGACTCC 
AAGGCCCAAG CCATCCTCCG CTGGCTCTCG GCCTACCTCA AGCCAGATGG TCAGTGGAAC 
GATCGCCGGG TGATCCTGTT CACGGAATAC CGCACCACGC ACCAGTGGAT GCATCAAATC 
CTCGCCAGCC ACGGCTTTGG CGGCGAGCGT CTCGGTCTGC TCCACGGTGG CCTATCGCAA 
GAAGAACGCG AACCCATCAA AGCGGCGTTC CAAGCTTCGC CGCAGGATTC GCCCGTGCGC 
ATCCTGCTCG CCACCGACGC GGCCTCCGAA GGCATCGACT TGCAGAACCA CTGCAATCGG 
CTCATCCACT TGGAGATTCC CTACAACCCC AACGTGATGG AGCAGCGTAA CGGGCGTATC 
GACCGCCACG GCCAGCGCGA GAAGGAAGTG CTGATCTGGC ACCCGGTCGA TGGTGGCGGC 
GCGAACGGCG CATCGGTCGG CGGCCTCGGC GAGGACATCC TTCGCGCCCT GCGGAAACTG 
GACTCGATGC GCGCCGACAT GGGCAGTGTC AATCCGGTCA TCGCGCCGCA GATGTCCGGC 
CTTATTGAAG GCTCCCTGAA GGACTTGGAC ACTCGCCTCG CCGAGGCCCG GATTGCCCGC 
GCCAAAAACT TCGTGCGCGC TGAACGAGAG TTGAAGGAGC GCGTCGCCAA GCTGCACGAG 
CGTCTGCTCA CCACCAAGCA GGATTTCCAC CTCACGCCCG ACCACGTCCT GATGGCCGTA 
AAGACCGGCC TCTCGCTGGC GGGCCGTCCG CCGCTGGAAC CGGTCGAACT TGCGGGCGCG 
CCTTCTGGCA GCGTCTTCCG GATGCCTGCG CTGTCCGGTT CGTGGGCGCG CTGTCTGCAA 
GGGCTGCGCC ACCCGCACAC CCAAAAGATT CGGCCCATCA CCTTCGACCA CGCCATCGCC 
AGTGGCCGCG ACGACGTCGT GCTCGTCCAC TTGAACCATC GCTTGGTGCA GATGTGCCTG 
CGTCTGCTGC GCGCCGAAAT CTGGGCACGG GACGACGTGA AGAAGCTGCA TCGTGTCACC 
ATCCGCACCA TGCCGGACGC GCTCGTCGAT GGCCCCGCCG TGGTCGTCGT TTCGCGGCTG 
GTAGTCACCG GCGGCAACCA CCACCGGCTG CACGAAGAAC TGACGGTATC GGGCGGCTAC 
CTACGCGACC AGTCCTTCCG CCGCGAAGAA GGTGTCACCC GCGTCCAGCA ATGGCTGGAT 
GAATCGAAAC CGATCACGGC GGCCCCGCCG CTGTTCGACG CGCTGCGCGT CCGCTTCGAC 
CGTCAGCAGG AAGCCATCCT GAAAGCCGTG GATGCCCGTT CCAAAGAACG CCTTCGTTAC 
CTGACCAACA CGCTTCAGAC TCGCAAGCAG CAGGAAATCG AGGACATCGG TACCGTGCTC 
GACGAATTGG AGAAGGCGAT CCAGTCCGAA TTGAAGAAAG GCGAGCAGCC CGAGCAGCTC 
ACGCTCTTCA CCGAGGACGA ACGCACGCAG CTCCACCGCG ACATCGCCGC GCTGGAGGCC 
CGCCTTGCAC GCATCCCCGG CGAGCGCCAG ATGGAGACTC AGGCCATCGA ATCCCGTTAC 
GCCAAGCTCG ACGACCGCAC CTTTCCGGTC GCCGTGATCT TCGTCGTCCC CGAGTCTACG 
TTAGAGGTGG CGATATGA

Protein sequence

MGVQSERQTQ AYRARPAPGQ LVEVRRRQWV VADIDAAGLS FGLPTPQHCV TLSSIDEDGL 
GEELEVIWEI EPGAQVIERA GLPSITGQDD SDVLDAFLDA VRWGAATNAD RGFLQAPFRS 
GVSIEDFQLD PLVRAIDMAR VNLLIADDVG LGKTVEAGLV IQELLLRHRA RTVLIVCPAS 
LQEKWRVEML EKFGLDFRVV DTDYIKRLRR ERGIHTNPWT SHPRLITSMD WAKGGEGLRA 
MRDVLPPHVG HPRKFDLLVV DEAHNVAPSA GAHYALESQR TRFVRAIGPH FQHRLFLTAT 
PHNGYTESFT SLLELLDDQR FARNILPDEN RLSQVMIRRL KSDLVDADGN PLYARRTLQA 
LEVPYTAEER EVHRKLDDYC ASREKDAENA GNGFGTAFVN RLLKKRLLSS PAAFASTLEK 
HVTSLSEARP AKLDTMAERI LHKAILKADE DYADDGDVEN AQAEAVEEAT RRSIPLTPEQ 
RATLDDLRAW AQRARNQADS KAQAILRWLS AYLKPDGQWN DRRVILFTEY RTTHQWMHQI 
LASHGFGGER LGLLHGGLSQ EEREPIKAAF QASPQDSPVR ILLATDAASE GIDLQNHCNR 
LIHLEIPYNP NVMEQRNGRI DRHGQREKEV LIWHPVDGGG ANGASVGGLG EDILRALRKL 
DSMRADMGSV NPVIAPQMSG LIEGSLKDLD TRLAEARIAR AKNFVRAERE LKERVAKLHE 
RLLTTKQDFH LTPDHVLMAV KTGLSLAGRP PLEPVELAGA PSGSVFRMPA LSGSWARCLQ 
GLRHPHTQKI RPITFDHAIA SGRDDVVLVH LNHRLVQMCL RLLRAEIWAR DDVKKLHRVT 
IRTMPDALVD GPAVVVVSRL VVTGGNHHRL HEELTVSGGY LRDQSFRREE GVTRVQQWLD 
ESKPITAAPP LFDALRVRFD RQQEAILKAV DARSKERLRY LTNTLQTRKQ QEIEDIGTVL 
DELEKAIQSE LKKGEQPEQL TLFTEDERTQ LHRDIAALEA RLARIPGERQ METQAIESRY 
AKLDDRTFPV AVIFVVPEST LEVAI