Gene BURPS1106A_2788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2788
Symbol
ID	4901461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	2747752
End bp	2748789
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	68%
IMG OID	640136015
Product	AraC family transcriptional regulator
Protein accession	YP_001067039
Protein GI	126454993
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATCGTC CAAGCAGTCC CGCCCGCACG ATACAGGTGG CGATCGTCGC TTTGCCGCCC 
GTATCGATGT CGGGTGTCGG GCCGATCGTC GACGCGCTGA ATCTCGCCAA CGAGATCGAC 
GGGCGCTTGC TGTACCGCTG GCAGGTGTGT TCGTGGGACG GCCGCGCGGT GCCGCTCGCG 
GGCGGCGCGC AATGGCACGC GCATGCCGCG TTCAACGACG CGATCGTCTG CGATTGGCTG 
ATTGTCGTGA GCGAGCGCTT CCAGCAGTTC GCCGACTACC GGCTGTTTCT CGCGAGCCTC 
GCGCGGGTCG GCCAGCGCAC GCCGCTCGTG ACGGGCATCC ATCACGGCGT GTGGTGGCTC 
GCGATGGCGG GGCAACTGTC GGGCTACCGG GTGAGCGTGA ACTGGGAGAC ATACCAGCAG 
TTCGCCGAGC AGTTCGAGCG CTCGATCGTC ACGCAGCAGA TCTTCGAGAT CGACCGCGAC 
CGCGCGACGT GCGCGGGCGG CCAGGCGAGC GTGGATTTCA TGCTGGCGAT GATCGGCCGC 
GACCAGGGGC CGGAGCTGGC GGAGCGGATT GCCGACGCGC TTGGCACCGG GCCGCTCAGA 
AGCGGCGAGG CGCGCCAGCG GATTCCGTTC GTGACGGCGC CGGGCGAGCG GCATCCGCGG 
TTGAACGACG CGCTGCTGCT GATGGAGGCG AACATCGAGG ATCCGCTGAC GACCGACGAG 
ATCGCGGGGC TCGTCGGCGT GTCGCGCCGG CAGCTCGAGC GACTCTTCAG ACAGTATCTC 
GGCGCGATGC CGTCGAAGTA CTACCTCAAC TTGCGGCTCT TGAAGGCGCG CACGCAATTG 
CAGCGCACGA GCAAGTCGGT CGTGCAGGTG AGCCTCGCGT GCGGGTTTTC TTCGGCTGCG 
CATTTTTCCA ATGCCTATCG GGAGCGGTTC GGCGTCACGC CGCGGGAGGA TCGGCGCGCG 
TGGCTCGAGA AGCAGCATGG GGGCGTCGAG CCGCCTCGGG CGGGGGCGAT GGTCGAGCGG 
CCCTCCGGGC GGGAGTGA

Protein sequence

MNRPSSPART IQVAIVALPP VSMSGVGPIV DALNLANEID GRLLYRWQVC SWDGRAVPLA 
GGAQWHAHAA FNDAIVCDWL IVVSERFQQF ADYRLFLASL ARVGQRTPLV TGIHHGVWWL 
AMAGQLSGYR VSVNWETYQQ FAEQFERSIV TQQIFEIDRD RATCAGGQAS VDFMLAMIGR 
DQGPELAERI ADALGTGPLR SGEARQRIPF VTAPGERHPR LNDALLLMEA NIEDPLTTDE 
IAGLVGVSRR QLERLFRQYL GAMPSKYYLN LRLLKARTQL QRTSKSVVQV SLACGFSSAA 
HFSNAYRERF GVTPREDRRA WLEKQHGGVE PPRAGAMVER PSGRE