Gene BURPS1106A_A0825 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0825
Symbol
ID	4904793
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	821593
End bp	822720
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	70%
IMG OID	640143931
Product	AraC family transcriptional regulator
Protein accession	YP_001074861
Protein GI	126455915
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.707047
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCGCTC CGCTCAATTA CACTGATCGT TTTTGCCATA CCGCGCCGCA GCGCGCACCC 
GCGATGAAGC ACGAAGAAAA GAAAGGCACC GTTTCGATCG AGCTCGTCGA GTCGAGCCTC 
GCGCTGTCGC GGCGGCGCGG CGTCGACGAC GCTTCGCTCC TCGCGCAGGC GGGCATTGCC 
GGCGCGCTGC TCGCGCAGCC GAACGCGCGC GTGTCCGCGC GGCAGTACGG CGCGCTGTGG 
AACGCGATCG CGCGCGCGCT CGACGACGAG TTCTTCGGCC AGGACTCACA CCCGATGCGC 
TGCGGCAGCT TCATCGCGAT GAGCCAGGCG GCGCTCACCG CGCGCAACGG GCTGCGCGCG 
CTCGCGCGCG CGGTCAACTT CATGCACTGC GTGCTCGACG ATCTGCACGC GCAGCTCGAC 
GCGAGCGCCG AGCGCGTACG GCTGCGCTTC GTGCATCGCA ACAGCGCGAA CCCGCCGGAG 
ATGTTCGCGT ATGCGACCTA TTTCGTCATC GTCTACGGCC TCACGTGCTG GCTGATCGGG 
CGGCGCATTC CGCTGCTGCA CGCGAGCTTT CGCTGCGGCG AGCCGCGCGC GGTCCACGAA 
TATCGGCTGA TGTTCTGCGA CGACATGCGT TTCGACGAGC CCGATTCGTA TGTCGATTTC 
GATCCGGCGT TCGCCGCGCT GCCCATCGTG CAGACGGCGC AGACGCTCAA GCCGTTCCTG 
CGCGACGCGC CCGCGAGCTT CATCGTCAAG TATCGCAACC CGCACGCGCT CGGCGAGCGC 
GTGCGCGCGG CGCTGCGCGC GCTGCCGCCC GCCGCGTGGC CGACCGCGCG CGCGCTCGCC 
GCGCGGCTGC ACGTGGCCGA GGCGACGCTG CGGCGCAAGC TGAAGCAGGA AGGCCATTCG 
TATCAATCGA TCAAGGACGC GCTGCGGCGC GATCTCGCGT GCGAGGCGCT CGCCGATCCG 
GCCCGCACGG TCGCCGACGT CGCCGCGGCG ACGGGCTTCG CCGAGCCGAG CGCGTTCTAC 
CGCGCGTTTC GCAAGTGGCG CGGGATGAGC CCCGCCGACT ACCGCGACGC CGCGCTCGCC 
GCGCGCGCGG CCGCTTCGCG CTTTCGCCGG AAACCGCCTA CTCTTTAA

Protein sequence

MLAPLNYTDR FCHTAPQRAP AMKHEEKKGT VSIELVESSL ALSRRRGVDD ASLLAQAGIA 
GALLAQPNAR VSARQYGALW NAIARALDDE FFGQDSHPMR CGSFIAMSQA ALTARNGLRA 
LARAVNFMHC VLDDLHAQLD ASAERVRLRF VHRNSANPPE MFAYATYFVI VYGLTCWLIG 
RRIPLLHASF RCGEPRAVHE YRLMFCDDMR FDEPDSYVDF DPAFAALPIV QTAQTLKPFL 
RDAPASFIVK YRNPHALGER VRAALRALPP AAWPTARALA ARLHVAEATL RRKLKQEGHS 
YQSIKDALRR DLACEALADP ARTVADVAAA TGFAEPSAFY RAFRKWRGMS PADYRDAALA 
ARAAASRFRR KPPTL