Gene BURPS1710b_1480 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_1480
Symbol	oruR
ID	3691692
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	+
Start bp	1554048
End bp	1555091
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	65%
IMG OID	637727936
Product	AraC family transcriptional regulator
Protein accession	YP_332884
Protein GI	76811313
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCACGT CCGTTCCGGA CCCCACGAGG CAATTGAACA AGGCGACCGT ATCGTCGGCC 
TATGCGCTTT TCATGCTGAT GCTCGCGGAA GAGCGCGGCA TCGCCGATGC GGACCTTCTC 
GCGCATACGG GCGTCACGCG CACGAAACTC GAGGAGCCTA ACGCGCGCAT CACGCCGCTG 
CAGCAGGCGG CGATCGTGTT CAATTTGCTC GGGATGACGA ACGATCCGTC GATCGCGATC 
GAGATCGGCC TGCGAAGCAG CCTGACGAAA TCGGGGCTGA TCGGCTTCGG CCTGATGAGC 
TGTGCGACGC TCGGCGAGGC GATCCAGCTC GGCATTCGCT ATCTGCCGAC GCGCGTGCCG 
TTCTTCTCGG TGCGGTTCAC GGAATTCGAG CACACGGTGC AGATCGACAT TCTCGAAGCG 
TTTCCGCTCG GCAGGCTGCG GCAATTCGCC GTCGAGAACT TCATGGTCGA GACGGCGATC 
CTGTTCAACT CGCTGCTGAC GCCTTCGCAT GACAAGACGA TGAAGGCGAA CGCCGAGCTC 
TGCTTCGAGT GGCCCGAGCC GCCTTATTTC GCACGTTATC GTGATCGCCT GCCGCGCTGC 
CATTTCGGCG CTCCAGCCAA TCAGATCCGT TGCGAGGCCG CGCTGCTCGA CGAGCCGATC 
AAGACCGCGA ACGCGCACAC GGCGCAGATG ATCGTCCAGC AGTGCGAGGC GGAGCTCGCG 
CGGCTCGGGT ATGCGGAGAG CATCGTCGAG CGCGTGCGCA ATCTGCTGAT TCGCGGCAGC 
CACGGCTATC CGTCGCTCGA CGCGCTCGCG CGCGAGCTCC ATCTGTCCGA GCGCACGCTC 
AAGCGCAAGC TGAGCGACTA TGGCACGACG TATTCGGCGC TGCTCGACGA GATCCGGCTG 
CGCGACGCGC TGCGTCTGCT CGAAGGCACG ACGCTGACGG TCGAGGAGAT CGCGGCACGC 
GTCGGCTATA CGGATCGCGC CAATTTCAGC CGCGCGTTTC GGCGCTGGAC CGGCACGTCG 
CCGAGCGACC GGCGCCGGAC GTGA

Protein sequence

MATSVPDPTR QLNKATVSSA YALFMLMLAE ERGIADADLL AHTGVTRTKL EEPNARITPL 
QQAAIVFNLL GMTNDPSIAI EIGLRSSLTK SGLIGFGLMS CATLGEAIQL GIRYLPTRVP 
FFSVRFTEFE HTVQIDILEA FPLGRLRQFA VENFMVETAI LFNSLLTPSH DKTMKANAEL 
CFEWPEPPYF ARYRDRLPRC HFGAPANQIR CEAALLDEPI KTANAHTAQM IVQQCEAELA 
RLGYAESIVE RVRNLLIRGS HGYPSLDALA RELHLSERTL KRKLSDYGTT YSALLDEIRL 
RDALRLLEGT TLTVEEIAAR VGYTDRANFS RAFRRWTGTS PSDRRRT