Gene BURPS1710b_A2062 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A2062
Symbol
ID	3691984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	+
Start bp	2509213
End bp	2511123
Gene Length	1911 bp
Protein Length	636 aa
Translation table	11
GC content	71%
IMG OID	637732315
Product	DJ-1/PfpI family protein
Protein accession	YP_337212
Protein GI	76817721
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.595101
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCGGC GCGCGGCGCG GCCGCGGGCG TTCGCTGGCG CGCCGCGCCG TGCATCGCTT 
CGAGGTCCGA TCGATCGGGG TGCACGCCAC GCGCCGTGCC GCGCGTCACG CTTGGCGAAA 
CCGCTCGCGA TACTCGTGCA GCGACGTATC GAACGCGCGC GCGAAGCTCC TGCGCAGCGT 
CGCGACGCTG CCGAATCCGC AGCGCTGCGC GATTTGCTTG ACGGGCAGCG CGGTTTCGCC 
GAGCAGGTTG CGCGCGGTCT CGACGCGGAT GCGCTCGACC GCCTTCGCGG GCGTCGTGCC 
GAACGCGTTC CGGTAATGGC GCACGAAGCT GCGCTCGCTC ATGTTGACGC GAGCGGCGAG 
CGTCGGCACC GACAGGTCGG CGCGCAAGTG GCGGCGAATC CACGCATGGA GATCGGCGAA 
CTGCCCGGAC GCGCTCTGCA TCTCGATCGA TTCGCTGAAT TGCGCCTGAC TGCCGGGCCG 
CACGAGGAAC ACCACGAGAT ACCGCGCGAG TGCGAGCGCG AGCGTATGGC CGCAGTCGTT 
CGAGACGAGG CGCAGACACA GATCGATGCC GGCCGTGACG CCCGCGGACG TCCAGATCGG 
GCCGTCCTGC ACGAAGATCG GCGCATGCTC GACGCGCACC CGGGGATGGC GTCGCGCGAG 
CGCGTCGCAG CATTGCCAGT GCGTGACCGC GCGGCGGCCG TCGAGCAGCC CGCACGCGGC 
GAGCAGGAAC GCGCCGTTGC AGATCGACAC CACGCGCCGC GCCTGCCGCG CGTGCGCGCG 
CAGCCACGCG AGCGTGTCCG CGCAGCGCGC GGCCGCGTCC ACGCCGGCGC CGCCCGCGAC 
GATCACCGTA TCCGCCGGCG CGTCGATGGG CGCGAGCGGC TGCGTCGACA GCGAGATGCC 
CGTCGAGGTT CGCACGCTGC GCCCGCCGCG CGCGACGACG CGGATGTCGT ACGGCGCGTC 
CGCGCCGGCT TCGCGCGAGA GCTCGTTGGC GCTCGACAGC ACCTGCAGCG GCCCCGACAG 
GTCGAGGAGA TTCAGGTCCG GAAAGACGAG GATGTAGACG ATCAGGCGCA TGGTTCAGGC 
GTTGGCGGAA ACTGCAACCA GTTTGGCATA AGCGCCAATC GGTCGCGCGC TACGCTGATT 
GTCGTGCGGG GCGATGCGCA CCGTCGCCTC GCGCATTTCG TGTTTCATCA TCATTTTCGA 
AAAGGACGAC CGATGTCTGC CACCGCACGA CGCCCCCTGA AAACCGGCTT TCTCCTCGCG 
CCCGGCGTTG CCGTGATGGA TCTGTTCGGC GCGCACGCCG TGTTCGGCTT CGCGCCGCGA 
TCCGAGCTGC ACCTGCTTTG GAAGACGCGC GAGCCGATCT CCGCGCTGCC GCCGTTTCCG 
ATCGCGGCGA CGACGACCTT CGCCGATTGT CCGGACGAGC TCGACGCGTT CGTCGTCGGC 
GCGGTGCCGG CCGACGTGAT CGCCGACGAC GAGGTGATTG CATTCGTGCG CCGGCAGGCG 
AGCCGCGCGC GCTATGTGAT CGGCATTTGC GGCGGCGTGC TGCTGCTCGG CGCGGCGGGC 
CTGCTGAACG GCCGCCGCGC GACGACCAAC TTTCATGTGC TGGACGCGCT CGCCGAGCTC 
GGCGCGCGGC CCGTCGGCGG CGGCGAGGTC GTGATCGACG GCAACCTGTA TACGGCCGGC 
CCCGCGACGG GCGGCTTCGA GGCGGCGCTG CTCGTGCTGG CCGAACTGCG TGGTGCCGAA 
GCGGCGAAGC ACGTCGAGCT GACGATCGAA TATCATCCGC GCGCGCCGTT CGGCGTCGGC 
ACGCCGGCGC TCGCCGGCCC GGCGCTGACC AATGAAGTGC TGGCCGCGCA CGCGTGGTTC 
TTCGATCCGT GCAAGGATGC CGCCAGGGCC GCATACGGGC GCGGGCGCTG A

Protein sequence

MRRRAARPRA FAGAPRRASL RGPIDRGARH APCRASRLAK PLAILVQRRI ERAREAPAQR 
RDAAESAALR DLLDGQRGFA EQVARGLDAD ALDRLRGRRA ERVPVMAHEA ALAHVDASGE 
RRHRQVGAQV AANPRMEIGE LPGRALHLDR FAELRLTAGP HEEHHEIPRE CERERMAAVV 
RDEAQTQIDA GRDARGRPDR AVLHEDRRML DAHPGMASRE RVAALPVRDR AAAVEQPARG 
EQERAVADRH HAPRLPRVRA QPRERVRAAR GRVHAGAARD DHRIRRRVDG RERLRRQRDA 
RRGSHAAPAA RDDADVVRRV RAGFARELVG ARQHLQRPRQ VEEIQVRKDE DVDDQAHGSG 
VGGNCNQFGI SANRSRATLI VVRGDAHRRL AHFVFHHHFR KGRPMSATAR RPLKTGFLLA 
PGVAVMDLFG AHAVFGFAPR SELHLLWKTR EPISALPPFP IAATTTFADC PDELDAFVVG 
AVPADVIADD EVIAFVRRQA SRARYVIGIC GGVLLLGAAG LLNGRRATTN FHVLDALAEL 
GARPVGGGEV VIDGNLYTAG PATGGFEAAL LVLAELRGAE AAKHVELTIE YHPRAPFGVG 
TPALAGPALT NEVLAAHAWF FDPCKDAARA AYGRGR