Gene BURPS1106A_A1655 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1655
Symbol
ID	4904472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	+
Start bp	1623605
End bp	1624657
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	69%
IMG OID	640144761
Product	AraC family transcriptional regulator
Protein accession	YP_001075689
Protein GI	126458411
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.365127
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACGGCG GGCGCCCGGC CGTGCACGCG CAGGAGCGAC AGATGAACCC AGACCTCGAG 
ATCGTCCCCA CCCGCCGCGA CGAATCGTTT CGCGCATGGT CGCACGACTA TCCGCACACG 
GTCGCGAAAT GGCATTTTCA TCCGGAGTAC GAAATCCACC TGATTCAGGG TTCGCGCGGC 
AAGTTCTTCG TCGGCGACCA TATCGGCGAT TTCGCGCCCG GCAACCTCGT CGTCACCGGG 
CCGAACCTGC CGCACAACTG GATCAGCGAG CTCGGCCCCG GCGAGCGCGT GCCGTCGCGC 
GACGTCGTGC TGCAGTTCTC GCGCGACGCG GCCGAGAAGA TGGTGGCCGC GTTCGCCGAG 
CTGCAGCCGG TGCTCGACCT GATCGACGAA GCGTCGCGCG GCGTGCAGTT TCCGGACGAG 
ATCGGGCTCG CCGTCGCGCC GCTGATGCTC GAGCTCGCGA GCGCGCACGG CTGCCGGCGC 
GTCGAGGTGC TGATGGCGCT GTTCGACCGG CTGGCGTCGT GCGCCGCGCG TCGCACGCTC 
GCCGGCCCCG GCTACCGGAT CGACGCGCAG CACTACATGT CGTCGACGAT CAACCAGGTG 
CTCGCGTACC TGCGGCAGAA CCTGCCGGGC GCGCTACGCG AGGCGGACGT CGCCGAATTC 
GCCGGCATGA GCGTGAGCAC GTTCACGCGC TTCTTCCGCC GGCACACGGG CTCGACGTTC 
GTCCAGTATC TGAACCGGCT GCGGATCAAC GAAGCGTGCG AGCTGCTGAT GTGCTCGGCG 
CTCAGCGTCA CCGACATCTG CTACCGCATC GGCTTCAACA ACCTGTCGAA CTTCAACCGG 
CAATTCCTCG CGATGAAGGG GATGCCGCCG TCGCGCTTTC GCGCGCTGCA TCGGTTGAAC 
GAGCCGCATG ACGCGCCCGA ACCGCACGAG CCGCACGCGT CGCTCGCGCC GGCCGCCGCG 
CCCGCGGCCC CGGGCGCGGC GGCCCGCCCT CCCGAGCGCG CCGCGCCCAC CGCGCGCGCC 
GTCATTCATT CGCACCGGAG CCTCCACCCG TGA

Protein sequence

MNGGRPAVHA QERQMNPDLE IVPTRRDESF RAWSHDYPHT VAKWHFHPEY EIHLIQGSRG 
KFFVGDHIGD FAPGNLVVTG PNLPHNWISE LGPGERVPSR DVVLQFSRDA AEKMVAAFAE 
LQPVLDLIDE ASRGVQFPDE IGLAVAPLML ELASAHGCRR VEVLMALFDR LASCAARRTL 
AGPGYRIDAQ HYMSSTINQV LAYLRQNLPG ALREADVAEF AGMSVSTFTR FFRRHTGSTF 
VQYLNRLRIN EACELLMCSA LSVTDICYRI GFNNLSNFNR QFLAMKGMPP SRFRALHRLN 
EPHDAPEPHE PHASLAPAAA PAAPGAAARP PERAAPTARA VIHSHRSLHP