Gene BURPS1710b_A1981 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1710b_A1981
Symbol
ID	3693405
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1710b
Kingdom	Bacteria
Replicon accession	NC_007435
Strand	-
Start bp	2418341
End bp	2419495
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	72%
IMG OID	637732235
Product	AraC family transcriptional regulator
Protein accession	YP_337132
Protein GI	76819530
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.382238
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATACCG GCACGCAGCG GCAAACGGCG CGCCGCCGCG GCGTGCGCTC GACGCCCGCG 
AACACTCGCC GGCCGCGCCG GCGCGCTGCC CGGCACGCGC CGGCACGACC TTCCCGCACC 
GCAAACGGGC ACGGTGCGGA AACCGCGGCA CATGCGTCTG CGCGCGGCGA GTGCCGATGC 
GGCGCGCCGC CGTATGCCGC GCGCGGGCGA GCGCTCGCGT CACGTCCCGC CCACCGCTTC 
CGGAACTGTT CCATGAGCTC GCCCGCACGC CATTCGCCGC CGCAAACGAT CACGAAGGAC 
TCGCTCGGCT GCACGTCGAG CGGCTTTCTG ACGGATATCG AACGCGAAAC GGCGCTCTTG 
CGCTTCTATC GGAAACACAC GACGGGCCTG CGCCTCGAGC AGGTCTCGAC ACCCGCGTCC 
GGGCGCGGCG TGCTGATCGG CATCTCGCTG TCCGGCGGCC ATCGCCGCAA GATCCTCCGC 
GGCCGCCGGT CGGTGACGCA CGACTTCCGC GCCGATTCGG TCTACGTGCG CGATTTCTCC 
GAAGACTATC GCGCGGACAT GATGTCGGAT TTCGACTTCG CGCTCGTCGA GCTGTCGCCG 
TCGTTCATCG ACGGCCTCGC CGAGCGCGGC CGCCCGGCGC GCATCGCCGG CGTCGCGCCG 
ACGCTCGCGC ACGACGACCG CCTGCTCGGC GAGCTCGGGC GCGCGCTCGC GCTCGCGCTG 
CAGTCGGGCG ACGCGGCCGA TGCCATGCTC GTCGATCAAT TGGGCATCGC GATCGGCACG 
CACGCGATGC ACGCGTACGG CGGCCTGCGC GCCGACGAGC CGAAGCAGCG GCGGCGCCTG 
TCGGCGCCGC TCGAGCGGCG CGCGAAGGAG ATGCTGGCGG CGGGCGCGAC GTCGGTGGAC 
GAAATCGCGC GTGCATGCCG CGTGTCGCGC GGCTACTTCA TCAACGCGTT CAGCGCGACG 
ACGGGCAAGA CGCCGCATCA GTGGCTGATC GAGCAACGCA TCGAAGCGGC GAAGCATCTG 
CTCGCGCACG GCGACTGGAC GCTCGCGCGC ATCGCCGAGC ATTGCGGCTT CTCGAGCCAG 
AGCCATTTCA CGCAGAGCTT CGCGAAGGCC ATCGGCCTGC CGCCCGGCGC GTGGCGCCGG 
CGCGCGCGCG CCTGA

Protein sequence

MHTGTQRQTA RRRGVRSTPA NTRRPRRRAA RHAPARPSRT ANGHGAETAA HASARGECRC 
GAPPYAARGR ALASRPAHRF RNCSMSSPAR HSPPQTITKD SLGCTSSGFL TDIERETALL 
RFYRKHTTGL RLEQVSTPAS GRGVLIGISL SGGHRRKILR GRRSVTHDFR ADSVYVRDFS 
EDYRADMMSD FDFALVELSP SFIDGLAERG RPARIAGVAP TLAHDDRLLG ELGRALALAL 
QSGDAADAML VDQLGIAIGT HAMHAYGGLR ADEPKQRRRL SAPLERRAKE MLAAGATSVD 
EIARACRVSR GYFINAFSAT TGKTPHQWLI EQRIEAAKHL LAHGDWTLAR IAEHCGFSSQ 
SHFTQSFAKA IGLPPGAWRR RARA