Gene BURPS1106A_A2526 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A2526
Symbol
ID	4906343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	2485970
End bp	2487079
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	73%
IMG OID	640145629
Product	DJ-1/PfpI family protein/transcriptional regulator, AraC family
Protein accession	YP_001076556
Protein GI	126456454
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0374888
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGTCG CGCCGGCTCG CGCCGACCGC ACCGGCGCGA TGGACAAACC GACTGTACGC 
AATTACCGTA TGGCGGATAT GCCAAAGTCC CCACAGTTCC CGCCAACGCC ATCGGCGGCC 
GCGCCCGCCG CCGCGCGCCG CGCGGTGCAC GTGCTCGCGT TCGACGATGT GCAGTTGCTC 
GACGTCACCG GGCCGCTGCA AGTGTTCGCG AGCGCGAACG ATTTCGCCGC GCGCCGCGGG 
CTCGCGATTC CGTACGCGCC GCGCGTCGTC GCCGCCCACG CGCCTTCGGT GATGTCGTCG 
GCCGGGCTCG CGTTCGCCGC CGCGCCGCTG CCCGCCGCGC GCGAGCCGTC CGATACGCTG 
ATCGTCGCGG GCGGCTGCGG CGTCCACGGC GCGGCGCGCG ATCCGCGGCT CGTCGACTGG 
GTGCGCCGGC GCGCGGCGCA CGCGCGGCGC ATCGCGTCGG TGTGCTCGGG CGCGTTCGTG 
CTCGCGGCGG CGGGGCTGCT GGGCGGACGC CGCGTCGTCA CGCACTGGTC GCGCTGCGAC 
GAGCTCGCGC AACGCTATCC CGACGTGCGC GTCGAGCCCG ATCCCATTTT CATCCGCGAC 
GGCAACGTCT GGACGTCGGC AGGCGTCACG GCCGGCATCG ATCTCGCGCT CGCGCTCGTC 
GAGGACGACC TCGGCCGCGC GCTGGCGCTC GACGTCGCGC GGTATCTCGT CGTGTTTCTG 
AAGCGCCCGG GCGGCCAGGC GCAATTCAGC GCCGCGCTGT CGCTGCAGCA CGAGGGCGGC 
TGCTTCGACG AACTGCACGC ATGGGCGGCC GCGAATCTCG GCGCGGACTT GTCGGTCGCG 
GCGCTCGCCG CGCGCGCCGG CATGAGCGAG CGCAGTTTCA TGCGCCGCTA CCGCGAAGCG 
ACCGGCAGGA CGCCCGCGCG GGCGATCGAG CAGATGCGCG TCGAAGCCGC GCGCAACCTG 
CTCGCCGACG CGCCGCTGCC GATCAAGCGG ATCGCCGCGC GCTGCGGATT CGGCAGCGAG 
GAAACGATGC GCCGCAGTTT CCTGCGCATG CTCGGCGTGG CACCGCAGGC CTATCGCGAG 
CGGTTCGCGA CGAATCGGCG AGGCGTCTGA

Protein sequence

MSVAPARADR TGAMDKPTVR NYRMADMPKS PQFPPTPSAA APAAARRAVH VLAFDDVQLL 
DVTGPLQVFA SANDFAARRG LAIPYAPRVV AAHAPSVMSS AGLAFAAAPL PAAREPSDTL 
IVAGGCGVHG AARDPRLVDW VRRRAAHARR IASVCSGAFV LAAAGLLGGR RVVTHWSRCD 
ELAQRYPDVR VEPDPIFIRD GNVWTSAGVT AGIDLALALV EDDLGRALAL DVARYLVVFL 
KRPGGQAQFS AALSLQHEGG CFDELHAWAA ANLGADLSVA ALAARAGMSE RSFMRRYREA 
TGRTPARAIE QMRVEAARNL LADAPLPIKR IAARCGFGSE ETMRRSFLRM LGVAPQAYRE 
RFATNRRGV