Gene BURPS1106A_1557 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1557
Symbol
ID	4899605
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	1506344
End bp	1507483
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	67%
IMG OID	640134787
Product	GntR family transcriptional regulator
Protein accession	YP_001065828
Protein GI	126451787
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.677062
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCAGT GGGCGCAGCG GATCGACCGG AGCGATTGGC CGTTCATCGG CGAGGGGCGC 
CCGACGCCAT TCGCGCCCTG CGTGGCCGAT GCCCGGGCGT TTCCGCACGC GATCTGGGGG 
CGATGCCTGC GCACGGCCAC CCGCTACGCC GTCGCGCGAA CGAGCACCGC GTGCAACCGG 
CCCGGGTTAC GCAGGGCCCT GTTGCATCAC CTCGTCGAAT ACCGCGGCGT CAACGCGGAT 
GCGCACCAGG TCTTCCTGAT GCCCACGGCT CAGGCGGCCA TCGCGCTCGT CGCACGCGTG 
CTCCTGGATC CGGGTGACCT CGCGTGGGTC GAAAGCCCGG GTTACGGCGG CGCACGGGCG 
GCGTTCGAAG CGGCGGGCGC GACGGTGCAA GGCATCGCGC TCGATCAAAG CGGCATGGCG 
TTCGAAACGT CGACGGATAC CCCGCGCCTG ATATTCGTCA CGCCCGCGCA CCAGCATCCG 
ACGGGATTGC TGATGCCGCC TGCCCGTCGA CAAGCGCTGC TGCGGTTCGC CGCTCGAGTC 
GGCGCCCGGA TCATCGAGGA CGACTACGAC AGCGAATTTC ATTACGAAGG GCGCCCGGTG 
GCCGCGCTGC AGGGTGCCGA CAACGCAGAC AGCGTGTTTT ACGTCGGCAC GTTCTCGAAA 
TCGCTGCACG CCGACATTCG AGTGGGTTAC GTCGTCGTAC CGGGGCACTT CGTCGACGTA 
TTTGCCAAGG CACAACGGCA CACCGGCCAG ATCGTCGGCG CGACGCTACA GGATGCGTTG 
GCCGAGTTCA TCGACGACGG ACATTACGCC GCTCACATCC GCAAGACGAC GCGCCTCTAT 
CACGCTCGAC GCGATTACCT GTGCGATGCG TTGAAGGCCG TCGGGAGCGA GTTGACCGTA 
TCGCCGCCGG ATGGCGGTAT GCAGGTGGTA GCCCGGCTCG GGCCCCTGCG CGACGATCGC 
GAGATATGCC GCCGCCTGGC CGAAGCGGGC GTGACGGCGC GCCCGCTTTC GCCCCATTAC 
TGCGCGCAAA CCGGCGCCCA AGGGCTATTC CTCGGCTTCG CGGCCTGGAA CGAATGCGAG 
ATCGACGCAG GCGTGCGGAT TCTCGCTCGC GTGATTCGCG AGCCGGAGCC ATCGAAATAG

Protein sequence

MSQWAQRIDR SDWPFIGEGR PTPFAPCVAD ARAFPHAIWG RCLRTATRYA VARTSTACNR 
PGLRRALLHH LVEYRGVNAD AHQVFLMPTA QAAIALVARV LLDPGDLAWV ESPGYGGARA 
AFEAAGATVQ GIALDQSGMA FETSTDTPRL IFVTPAHQHP TGLLMPPARR QALLRFAARV 
GARIIEDDYD SEFHYEGRPV AALQGADNAD SVFYVGTFSK SLHADIRVGY VVVPGHFVDV 
FAKAQRHTGQ IVGATLQDAL AEFIDDGHYA AHIRKTTRLY HARRDYLCDA LKAVGSELTV 
SPPDGGMQVV ARLGPLRDDR EICRRLAEAG VTARPLSPHY CAQTGAQGLF LGFAAWNECE 
IDAGVRILAR VIREPEPSK