Gene BURPS1106A_3203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3203
Symbol
ID	4899954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	3119985
End bp	3120932
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	71%
IMG OID	640136429
Product	AraC family transcriptional regulator
Protein accession	YP_001067441
Protein GI	126453049
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.10279
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCACGCGC CTTCCCCGCC TCCGCTCGAC GCCCGCCTGT CCGTGCCCGC CGCCGATTTC 
GTCGGCGGCG AAGTGCCGTT CGGCCTGCAA TCCGTCTGCC GGACGCTCGC CGAGGCGAAC 
GCGAAGCTCG AGCGCTTCGC ATGGCTCGGC GATCATCTCG CGATCGCCGA ATGGACGCGC 
GTCACCGACG AAAGCGAGAC GGTGTACGCG CAGCCCGGAC ATCACACGCT ATCGTGCTAC 
CTGGACGGCG GCTACCGCAC CGAGCGGCAA AAAATCGCGC GCTACGGCGC GCCGAGCCTG 
CTCTGCGCGC TGCCGGGCGA CCACGAATCG CGCTGGTGGG TGCGCGGCGA GATGCACTTC 
GTGCACCTGT ACTTTCTGCC CGAGCACTTC GCGCGGCGCG CGGTGCGCGA GCTCGATCGC 
GAGCCGCGCG AGCTGAAGCT CGCCGATCGC ACGTATTTCG AGGATGCGCG CGTCGCCGCG 
CTATGCCGCT CGCTCGCGCT CGAGCGCTGG GACGACGCCG ATGGCCGGCT GCGCGTGAAC 
GAAACCGCGC ACGAGGTGCT GAGCCTCCTG CTGCGCGGGC AGAGCATGAC GGGCGCCGGC 
GCGCCGTTCA AGGGCGGCCT CGCGCCCGCC GTGCGCCGGC GCGTGCGCGA CTACATCGAC 
ACGTACCTCG CGCACCCGAT GACGCTCGGC GAGCTCGCGC AGATCGCGTC GCTGTCCGAA 
TACCATTTCT CGAGGATGTT CAGCGTATCG TTCGGCCGCG CGCCGCACGC GTGGATCGCC 
GAGCAGCGCC TCGCCCGCGC GCGCACGCTG CTGCGCACGA CATCGCTACC GCTCGCGCAG 
GTCGCCGCGC AATGCGGCTA TGCGAACGCC GTGCATCTCA GCCACCGCTT TCGCGACACG 
CACGGCGCGA CGCCGGGCGC GTACCGCCGC GCGATGCAGG CCGCCTAG

Protein sequence

MHAPSPPPLD ARLSVPAADF VGGEVPFGLQ SVCRTLAEAN AKLERFAWLG DHLAIAEWTR 
VTDESETVYA QPGHHTLSCY LDGGYRTERQ KIARYGAPSL LCALPGDHES RWWVRGEMHF 
VHLYFLPEHF ARRAVRELDR EPRELKLADR TYFEDARVAA LCRSLALERW DDADGRLRVN 
ETAHEVLSLL LRGQSMTGAG APFKGGLAPA VRRRVRDYID TYLAHPMTLG ELAQIASLSE 
YHFSRMFSVS FGRAPHAWIA EQRLARARTL LRTTSLPLAQ VAAQCGYANA VHLSHRFRDT 
HGATPGAYRR AMQAA