Gene BURPS1106A_A1931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A1931
Symbol
ID	4904145
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	1891054
End bp	1892052
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	71%
IMG OID	640145037
Product	AraC family transcriptional regulator
Protein accession	YP_001075965
Protein GI	126456291
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.746291
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGTCCG CCGCCGCTGC CGCACCCGCC GCCTGCGCCG AGCCGGTTCC CTCGGTCGCG 
CATTTCGGGT TCCTGACGTT GCCGAATTTC TCGATGATCG CGTTCACGAG CGCGGTCGAG 
GTGCTGCGCA TGGCGAACTA CGTCGCGCGC GCGGACCATT ACCGCTGGTC GATCTTCTCG 
CTCGACGGCG CGCCCGTGCG CGCGAGCAAC GGCATCGCGG TGCGGCCGAC GCAGCCGCTC 
GACGTCGACG ATCCGCCGGA CGTGGTGATC GTCTGCGGCG GCATCCGGAT TCGCGAGGCG 
GTGGACGAGC GGGTGCGCGA CGCGCTCGGC GCGCTCGCCG CGCGCGATGT GCCGCTCGGC 
GGCATCTGCA CGGGCGCGTA TGCGCTGATG GCGTGCGGGC TGCTCGACGG CTACCGCTGC 
GCGGTGCACT GGGAGAACCT GTCCGCGCTG CACGCGGAGT TTCCGCGGGT GCGCTTCGCC 
GACGAGCTGT TCGCCGTCGA TCGCGACCGG CTCACCTGCA CGGGCGGCAC CGCGCCGCTC 
GACCTGATGC TGAACCTCGT CGGCGCGCGG CTCGGGCAGC CGCTCGCCGC GCAGGTCTCC 
GAGCAGTTCA TTCTCGAGCG CATCCGCGGC GCGACCGATC CGCAGCCGAT TCCGGTCGAC 
GCGCGCGTCG GCTTCTCGCG CGCGGAGCTG ATCGAGGTCG TGCGGCTGAT GGAGGCGAAC 
ATCGAGGAGC CGCTGTCGCT CGAGGAACTC GCGCGGCTCG TGCGGCTGTC GCAGCGGCAC 
CTGCAGCGGA TGTTCAAGAT CTATCTGAAC GTATCGCCCA CGCACTACTA CCTGACGCTG 
CGCCTGAAGC GCGCGCGCGA CCTGCTGCGC ACCACCGACG CATCGATCGC GCGCGTGACG 
GCGGTCTGCG GCTTTCATTC GCCGTGCCAT TTCAGCAAGG CGTACCGCGC GCAGTTCGGC 
CATGCGCCGA GCCACGAGCG GCGCGTATCG GCGCGCTGA

Protein sequence

MTSAAAAAPA ACAEPVPSVA HFGFLTLPNF SMIAFTSAVE VLRMANYVAR ADHYRWSIFS 
LDGAPVRASN GIAVRPTQPL DVDDPPDVVI VCGGIRIREA VDERVRDALG ALAARDVPLG 
GICTGAYALM ACGLLDGYRC AVHWENLSAL HAEFPRVRFA DELFAVDRDR LTCTGGTAPL 
DLMLNLVGAR LGQPLAAQVS EQFILERIRG ATDPQPIPVD ARVGFSRAEL IEVVRLMEAN 
IEEPLSLEEL ARLVRLSQRH LQRMFKIYLN VSPTHYYLTL RLKRARDLLR TTDASIARVT 
AVCGFHSPCH FSKAYRAQFG HAPSHERRVS AR