Gene BURPS1710b_1023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_1023
Symbol	darR
ID	3690151
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007434
Strand	-
Start bp	1071970
End bp	1073007
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	69%
IMG OID	637727479
Product	AraC family transcription regulator
Protein accession	YP_332435
Protein GI	76808651
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.243872
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGCGC AAACTCCCCT CCGGCATCGG ACGACGACGA CCGTCGATGT CGTGATCTAT 
CCGGGATTCA AGGCGATCGA GGCCGTCGGC GTCATCAACG TGTTCGACTA CGCGAACGCG 
CGGCTCGCCG CCGCGGGGCT CGCGCCCGTC TACGATCTCC AGATTGCCGC GCCCGCGAAG 
GGCGCGGTCA AGTCCGACAC CCTCATCGTG CTCGAGGCGA CGAAGGCGCT CGACACGCTC 
GCGGTGCCCG ACACGGCGAT CGTCGTCGGC GCGCGCGACA TCGAGCGGGC GCTGCGCGAC 
ACGTCGATGC TCGTCGGATG GTGCCGCGAC GTGTCCGCGC GCATCGGCCG GATGGTCGGG 
CTGTGCTCGG GCTGCTTCTT TCTCGCCGAA GCCGGCATGC TGGACGGCCG GCGCGCGACG 
ACGCACTGGA GCGTCGCCCC CCTGTTGCGG GCGCGTTATC CGGCGGTGAA GGTGGAGCCC 
GACGCGATCT TCGTTCGCGA GGGCAACGTG TGGACGTCGG CGGGCGTCAC GGCCGGCCTC 
GATCTCGCGC TCGCGATGGT CGAGGAGGAT CTCGGTCGCG AGATCGCGCT CGCCGTCGCG 
CGCGATCTCG TGATTTACCT GAAGCGGCCG GGCGGCCAGT CGCAGTTCAG CGTGTACCTG 
GCGAGCCAGA TGACCGCGCA CGCGTCGATC CGCGACATTC AGGACTGGAT TCTGAACGCG 
CTCGACGCGC GGCTGAGCAT CGCGCAGCTC GCCAGGCGCG CCGCGATGAG CGAGCGCAAC 
TTCATTCGCG TGTTCGTGCG CGAAACCGGC TATCGTCCGG CCGAATTCAT CGAAATCGCG 
CGGCTCGAAA AAGCGCGCCG CCTGCTCGAG CAGGAAGCGC TGCCGCTGAA GACGGTGGCC 
GTGCGCAGCG GGTTTCGTTC CGACGACCAA TTGCGGCGCG TGTTCATGCG CCGCCTCGGC 
GTGACGCCCG GCGCGTATCG CGAGCGGTTC TCCGGCACCG GCGTGCGCGA AGCGCGGGGG 
AGCGGCGACG TGGATTGA

Protein sequence

MAAQTPLRHR TTTTVDVVIY PGFKAIEAVG VINVFDYANA RLAAAGLAPV YDLQIAAPAK 
GAVKSDTLIV LEATKALDTL AVPDTAIVVG ARDIERALRD TSMLVGWCRD VSARIGRMVG 
LCSGCFFLAE AGMLDGRRAT THWSVAPLLR ARYPAVKVEP DAIFVREGNV WTSAGVTAGL 
DLALAMVEED LGREIALAVA RDLVIYLKRP GGQSQFSVYL ASQMTAHASI RDIQDWILNA 
LDARLSIAQL ARRAAMSERN FIRVFVRETG YRPAEFIEIA RLEKARRLLE QEALPLKTVA 
VRSGFRSDDQ LRRVFMRRLG VTPGAYRERF SGTGVREARG SGDVD