Gene BURPS668_3935 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3935
Symbol	eutR
ID	4882492
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	3835047
End bp	3836075
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	73%
IMG OID	640129863
Product	ethanolamine operon transcriptional activator EutR
Protein accession	YP_001060928
Protein GI	126438810
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATCACG AGCACACCGG CGCCGAGACG ACGGCGGAGG ACACCGGGCG CAGCGCGGAC 
GGCGACGGCG GCGCGGCCGG GCGCGCGCTC GTGAGCGTCG CGCACGACGC CGACGAGCAG 
GCGCGCAACC TGATCGGCTG GCGCCAGACC TACGACCAGC TCGCGGCGGG CCGCTTCGTC 
GGCACGTTGA CCGAACTGCC GCTCGACACG ATGAAGGTGT TCCGGGAGAC GACGAGCCAT 
ACGCTGCGGC AGGCGTGCGA GGTGCGCGGC GATGCGTACT GGTTCGGCAT TCCGCTCGCG 
CGCGACGGCG CGGCGCGCAT CGACGCGCGG CCGATCGCCG CCGACGCGCT CGCGTTCCGG 
CCCGGCAACG TCGAGTTCGA GCTGTTGACG CCCGCGCAAT TCTCGATCTA CGGAGTGGTC 
GTGCGCGGCG CGGTGTTGCG CCGTTACGCG CAGGAGGTCG AGCGCTGCGG GCTCGACGAG 
CGGTTGCCGC TCGTGCCCGT CGTGCGCGTC GGCGAGGCGC GGCTCACGCG GCTGTGCGCG 
TTGCTCGCGC AGCGTCTGAA CGACGCCGAC GCGATGAGCG CGGCGGGCGA GCCGCTATCC 
GACTGCGCGC GCAACGACCT GCAGGCGGAA GTGCTCGCGG CGCTGTTCGA CCTGTGCGCG 
TCGCCCGCGG CCGACGCGAG CGTCGAGCAC TCGTCGCGGC GCCGCAAGAT CGTCGCGGCC 
GCGCGCGACT ACGTGCTCGC GCATCGCTCG CGGCCTGTCG GCGTGCCGGA GCTGTGCGAG 
CAACTGCACG TGAGCCGGCG CACGCTGCAG TATTGCTTCC AGGATGTGCT CGGGATGGCG 
CCCGCGACCT ACCTGCGCGC GCTGCGGCTC AACGGCGTGC GGCGCGATCT GCGCGGCCGC 
GCGGCCGCCT CGGTGCAGGA CGCCGCGGCT GCATGGGGGT TTTGGCATCT GAGCCAGTTC 
GCGACCGATT ATCGGCGGAT GTTCGGCGCG CGGCCGTCGG AGACGCTGCG CGACGCGCTC 
GCCTGTTGA

Protein sequence

MDHEHTGAET TAEDTGRSAD GDGGAAGRAL VSVAHDADEQ ARNLIGWRQT YDQLAAGRFV 
GTLTELPLDT MKVFRETTSH TLRQACEVRG DAYWFGIPLA RDGAARIDAR PIAADALAFR 
PGNVEFELLT PAQFSIYGVV VRGAVLRRYA QEVERCGLDE RLPLVPVVRV GEARLTRLCA 
LLAQRLNDAD AMSAAGEPLS DCARNDLQAE VLAALFDLCA SPAADASVEH SSRRRKIVAA 
ARDYVLAHRS RPVGVPELCE QLHVSRRTLQ YCFQDVLGMA PATYLRALRL NGVRRDLRGR 
AAASVQDAAA AWGFWHLSQF ATDYRRMFGA RPSETLRDAL AC