Gene BURPS668_A1119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A1119
Symbol
ID	4887653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	1074493
End bp	1075725
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	68%
IMG OID	640131059
Product	putative purine catabolism transcriptional regulator
Protein accession	YP_001062118
Protein GI	126444990
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism [T] Signal transduction mechanisms
COG ID	[COG2508] Regulator of polyketide synthase expression
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCTGA CCATCAGCGA GATCCTGCAA CTGCCCGGTC TCGAAGAGCT CCAGCTGCGC 
GCGGGCGAGC GCAGCGTGCA GCGGCCGGTG CGCTGGTACT ACGTCGCGGA GAACGAAGGC 
ATCGCCGATT GGGTGATGGG CGGCGAGCTC GTGTTCGTCA CCGGGATCAA TCATCCGCGC 
GACGAGGCGA ACCTGCTGCA GCTGATTCGC GAGGGCGCGA AGAGCCGCAT CGCCGGGATG 
GTGATCCTGA CGGGCGAGGC GTTCATCCGC CGCATCCCCG ATTCGGTCGT CGCGCTCGCC 
GAGCAGCTCG AGATCGTGCT GATCGAGCAG CCGTATCTGC TGAAGATGGT GATCGTCACG 
CAGTTGATCG GCACCGCGCT CGCGCGGCAC GAGAACACGC TGCGCTCGCA GCGCGACATC 
GTGAACCAGC TGCTGACGGG CGACTACCCG AGCATCGACA TCGCCGCCCA TCGCGCGCGC 
AATCTGCAGC TCGCGCTCGA TCGGCCGCGC CGCGTCGTCG CGCTGCGGCT CGCGGGCGTG 
CCCGCGCTTT TCGAAGGGCG CGATCCGGCC GCGGCGGAGG CGCTGCTGCA GGATGCACGG 
CAGACGGTTC AGCGCGGCCT CGACGACTGG CTGCGCGACG AGGAAGGCGC ACTGCCCGTC 
GTCGAGCAGG GCGAGCTGTT CGTGCTGCTG CTGCCGTGCG ACGATCCGCG CTTCAGGAAG 
CAAAAGCTCG CGCTCGGCGC GCTGCGCGAC GCGTTGAACC GGCAAACCGG GCCGCTCGCG 
CTGTTCGTCG GGATTTCGTC GACGGTCGGC GCCGCGCGCC ATTATTGCCG CGGGCTCGCC 
GAGGCGCGGC AGGCGCTCGG CGTTGCCGAG GGCATGCGCG CGGGGCAGGG CCTGTGCGAC 
TACAGCGAGC TCGGCGTGCT GAAGCTGCTC GCCGCGATTC CCGATCCGAC GCTGATCGAC 
GGCTTCGTGA AGGAAACGCT CGGCAATCTG CTCGACAGCA ACCGCAAGCA TCCGACGATG 
CTGATCGAGA CGCTCGAGGC GCTGCTTCAG GAAAACGGCA ACGCGATCAA GGCGGCCGAG 
CAGTTGTCGA TCCACCGCAA CACGCTCAAT CACCGGCTGC GCAGGATCGA GACGCAGTCG 
GGGCAATCGC TCGCCGATCC GTATTTTCGG CTGAACGCAT CCGTCGCGCT GCTCGCGTGG 
CGGATGTCGG ATACGCAACG ACAGGAGTTC TGA

Protein sequence

MSLTISEILQ LPGLEELQLR AGERSVQRPV RWYYVAENEG IADWVMGGEL VFVTGINHPR 
DEANLLQLIR EGAKSRIAGM VILTGEAFIR RIPDSVVALA EQLEIVLIEQ PYLLKMVIVT 
QLIGTALARH ENTLRSQRDI VNQLLTGDYP SIDIAAHRAR NLQLALDRPR RVVALRLAGV 
PALFEGRDPA AAEALLQDAR QTVQRGLDDW LRDEEGALPV VEQGELFVLL LPCDDPRFRK 
QKLALGALRD ALNRQTGPLA LFVGISSTVG AARHYCRGLA EARQALGVAE GMRAGQGLCD 
YSELGVLKLL AAIPDPTLID GFVKETLGNL LDSNRKHPTM LIETLEALLQ ENGNAIKAAE 
QLSIHRNTLN HRLRRIETQS GQSLADPYFR LNASVALLAW RMSDTQRQEF