Gene BURPS1106A_A0234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_A0234
Symbol
ID	4903631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009078
Strand	-
Start bp	218984
End bp	220330
Gene Length	1347 bp
Protein Length	448 aa
Translation table	11
GC content	68%
IMG OID	640143341
Product	LysR family transcriptional regulator
Protein accession	YP_001074277
Protein GI	126457796
COG category	[K] Transcription
COG ID	[COG0583] Transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGCCG CCGCATCGCA TTGCGTTGCC GATGAACCGA TTGCCGCGCA TGAAGAACCA 
GAGCCGCGAC GCGTACCGGC CCGCCCGGGC CCGCTTGCGC GGCGCGCGCA TGCGAAGCGA 
AACGAAGCCG GCGGCCGCCG CATCGGCGAC GCCGCACGCC CAATCCGCGC GCCGGCGGCA 
GCGAGCCGCG CCGCGCGCGT TCGCGCCCGC CCGAGGTGGC GCCCGCCCAC GATACGCTGC 
GCCGCCCCTC CCGCATGCGG CGCAACAGCC ATCGTCCCGA TCCATATCCA GCACCGGGCT 
CATGTCGCCG AATCGCGATG CAGCGCCCGC GCGACATCGG CGCCTCGCCC GCGAACGGGC 
GAGCGCCGCT CGGTATTTCG AAACATGACC GTTCTTGAGG TGGGAAATAT GTCCGAGGTG 
GGGATAAGAA ATTTGAATCA CCTGCGCGTT TTCATGGCGA TCGTCGAGAA GGGCAGCTTC 
ACTGCGGCGG CCGAATGCCT GAGCATGTCG AAATCACTGG TCAGCGAATA CCTGAGCCGC 
CTCGAAGCCG AGATCGACAC GCAGCTCGTG ATGCGCAGCA CCCGCCGGAT CGCGCCGACC 
GACGCCGGCA ACAAGCTGTA TTGCGCGTCG CAGGCGTTCG TGAGCGGCCT GTACGACGTG 
ATCGGCAGCA TCCGCTGCCT GCGCCACGAA TCGACCGGCC TGTTGCGCGT CGCGGCGCCG 
AGCGGCTTTT CCACCACGCA TCTGAGCTCG ATCGCCGCGA CCTTCATTCA CCAGCATCCG 
CAGATCGAGC TCGAGATCGT CTGCAACGAC GACGAGATCG ATCTGGTGGG CGAGCGCGTC 
GATCTCGCGT TCGAAACCGG ATGGCCCAAG AAGAAGGGCT TCCGGATGAA GATGCTCGGC 
GCGTTCGATC AGGTGCTCGT CGCGTCGCCC GAGTATTCGC GCAGGCACGC GGTGCCGCGG 
CATCCGGACG ATCTGCCCGG CTCGCACTGG ATCGGGCACG GCGGGCTCGC CAATCTCAGC 
TATTCGGTGT TCGGCAACGA GGGGCGATCG GTCCGGATTC AGACCCCCGG GCGCCTGAAG 
GTGAAGAGCG TGCTGCTCGC GCATCAGATG GCGCTCGCCG GCGCGGGCAT CAGTGCGTTT 
CCCGATTATC TGGTCGCCGA GGATCTGCGC GAAGGGCGCC TGCATCGGCT GCTGCCGACG 
TGGACGATGC CGAAGGGCGG CATCTACGCG TTTCGCACGG CGCCGCGGCA GGCGTCGGTT 
CGCGAGCGCC TGTTTCTCGC CGCGGTCCAG GCGTATCTGG CCGGCCTGTG CGGCGAGCAC 
GCGCGCGCGG GCGCGGTCCC GACCTAG

Protein sequence

MIAAASHCVA DEPIAAHEEP EPRRVPARPG PLARRAHAKR NEAGGRRIGD AARPIRAPAA 
ASRAARVRAR PRWRPPTIRC AAPPACGATA IVPIHIQHRA HVAESRCSAR ATSAPRPRTG 
ERRSVFRNMT VLEVGNMSEV GIRNLNHLRV FMAIVEKGSF TAAAECLSMS KSLVSEYLSR 
LEAEIDTQLV MRSTRRIAPT DAGNKLYCAS QAFVSGLYDV IGSIRCLRHE STGLLRVAAP 
SGFSTTHLSS IAATFIHQHP QIELEIVCND DEIDLVGERV DLAFETGWPK KKGFRMKMLG 
AFDQVLVASP EYSRRHAVPR HPDDLPGSHW IGHGGLANLS YSVFGNEGRS VRIQTPGRLK 
VKSVLLAHQM ALAGAGISAF PDYLVAEDLR EGRLHRLLPT WTMPKGGIYA FRTAPRQASV 
RERLFLAAVQ AYLAGLCGEH ARAGAVPT