Gene BURPS668_0861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0861
Symbol
ID	4883223
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	840783
End bp	841817
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	69%
IMG OID	640126789
Product	DJ-1/PfpI family protein/transcriptional regulator, AraC family
Protein accession	YP_001057912
Protein GI	126439934
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGCGC AAACTCCCCT CCGGCATCGG ACGACGACCG TCGATGTCGT GATCTATCCG 
GGATTCAAGG CGATCGAGGC CGTCGGCGTC ATCAACGTGT TCGACTATGC GAACGCGCGG 
CTCGCCGCCG CGGGGCTCGC GCCCGTCTAC GATCTCCAGA TCGCCGCGCC CGCGAAGGGC 
GCGGTCAAGT CCGACACCCT CATCGTGCTC GAGGCGACGA AGGCGCTCGA CACGCTCGCG 
GTGCCCGACA CGGCGATCGT CGTCGGCGCG CGCGACATCG AGCGGGCGCT GCGCGACACG 
TCGATGCTCG TCGGATGGTG CCGCGACGTG TCCGCGCGCA TCGGCCGGAT GGTCGGGCTG 
TGCTCGGGCT GCTTCTTTCT CGCCGAAGCC GGCATGCTGG ACGGCCGGCG CGCGACGACG 
CACTGGAGCG TCGCCCCCCT GTTGCGGGCG CGTTATCCGG CGGTGAAGGT GGAGCCCGAC 
GCGATCTTCG TTCGCGAGGG CAACGTGTGG ACGTCGGCGG GCGTCACGGC CGGCCTCGAT 
CTCGCGCTCG CGATGGTCGA GGAGGATCTC GGCCGCGAGA TCGCGCTCGC CGTCGCGCGC 
GATCTCGTGA TTTACCTGAA GCGGCCGGGC GGCCAGTCGC AGTTCAGCGT GTACCTGGCG 
AGCCAGATGA CCGCGCACGC GTCGATCCGC GACATTCAGG ACTGGATTCT GAACGCGCTC 
GACGCGCGGC TGAGCATCGC GCAGCTCGCC AGGCGCGCCG CGATGAGCGA GCGCAACTTC 
ATTCGCGTGT TCGTGCGCGA AACCGGCTAT CGTCCGGCCG AATTCATCGA AATCGCGCGG 
CTCGAAAAAG CGCGCCGCCT GCTCGAGCAG GAAGCGCTGC CGCTGAAGAC GGTGGCCGTG 
CGCAGCGGGT TTCGTTCCGA CGACCAATTG CGGCGCGTGT TCATGCGCCG CCTCGGCGTG 
ACGCCCGGCG CGTATCGCGA GCGGTTCTCC GGCACCGGCG TGCGCGAAGC GCGGGGGAGC 
GGCGACGTGG ATTGA

Protein sequence

MAAQTPLRHR TTTVDVVIYP GFKAIEAVGV INVFDYANAR LAAAGLAPVY DLQIAAPAKG 
AVKSDTLIVL EATKALDTLA VPDTAIVVGA RDIERALRDT SMLVGWCRDV SARIGRMVGL 
CSGCFFLAEA GMLDGRRATT HWSVAPLLRA RYPAVKVEPD AIFVREGNVW TSAGVTAGLD 
LALAMVEEDL GREIALAVAR DLVIYLKRPG GQSQFSVYLA SQMTAHASIR DIQDWILNAL 
DARLSIAQLA RRAAMSERNF IRVFVRETGY RPAEFIEIAR LEKARRLLEQ EALPLKTVAV 
RSGFRSDDQL RRVFMRRLGV TPGAYRERFS GTGVREARGS GDVD