Gene BURPS668_1533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_1533
Symbol
ID	4883463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	1496063
End bp	1497742
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	67%
IMG OID	640127461
Product	GntR family transcriptional regulator
Protein accession	YP_001058574
Protein GI	284159914
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGTGGCCTC GGCTGTCGGG GAACTTCGGT GGCGGGCGGC CGCGCGCGAA GCGCGGCGCA 
AGCGCATCCG CGCGGTGCGA CGGCGCCGGC GGCGCCCATC GTCGACGGCC CGCACGCAAG 
CGCCGCGAAG GCGCGCGCCG CGGCGAAAGT CGATACGACT ATAGGTTTGA CCGGTATTTC 
CCGGAAGGGT ATGTTTTTGT AAAAACATGG GGCCAGTTTA TGGTTGAGAC GCTCGCCGGT 
TTATTCGATT TCGAGATGGA CCCGCAAAGC GGCGTGGCGC TCACGCGGCA GCTCCGTGAC 
CAGCTAAGGC GCGCCATCGC GGCGGGTTCG CTTGCAAGCG GCAGGCGTTT GCCTTCCAGC 
CGGGCACTCG CGCTCCATCT GCGCGTGTCG AGAAACACCG TCTGCGCCGC CATCGAGCAG 
TTGGCGATGG AAGGCTATCT CGATGTCTCG AGAGGACGCC GCCCGGTCGT GGCGCCGATG 
CCGTCGGCGA GCCTCGTCGC CATCGGCTCG GACAGGCCTG TTTCGGACGG CCGCAGCGGA 
ATGTCGCAGT GGGCGCAGCG GATCGACCGG AGCGATTGGC CGTTCATCGG CGAGGGGCGC 
CCGACGCCAT TCGCGCCCTG CGTGGCCGAT GCCCGGGCGT TTCCGCACGC GATCTGGGGG 
CGATGCCTGC GCACGGCCAC CCGCTACGCC GTCGCGCGAA CGAGCACCGC GTGCAACCGG 
CCCGGGTTAC GCAGGGCCCT GTTGCATCAC CTCGTCGAAT ACCGCGGCGT CAACGCGGAT 
GCGCACCAGG TCTTCCTGAT GCCCACCGCT CAGGCGGCCA TCGCGCTCGT CGCACGCGTG 
CTCCTGGATC CGGGTGACCT CGCGTGGGTC GAAAGCCCGG GTTACGGCGG CGCACGGGCG 
GCGTTCGAAG CGGCGGGCGC GACGGTGCAA GGCATCGCGC TCGATCAAAG CGGTATGGCG 
TTCGAAACGT CGACGGATAC CCCGCGCCTG ATATTCGTCA CGCCCGCGCA CCAGCATCCG 
ACGGGATTGC TGATGCCGCC TGCCCGTCGA CAAGCGCTGC TGCGGTTCGC CGCTCGAGTC 
GGCGCCCGGA TCATCGAGGA CGACTACGAC AGCGAATTTC ATTACGAAGG GCGCCCGGTG 
GCCGCGCTGC AGGGTGCCGA CGACGCAGAC AGCGTGTTTT ACGTCGGCAC GTTCTCGAAA 
TCGCTGCACG CCGACATTCG AGTGGGTTAC GTCGTCGTAC CGGGGCATTT CGTCGACGTA 
TTTGCCAAGG CACAACGGCA CACCGGCCAG ATCGTCGGCG CGACGCTACA GGATGCGTTG 
GCCGAGTTCA TCGACGACGG ACATTACGCC GCTCACATCC GCAAGATGAC GCGCCTCTAT 
CACGCTCGAC GCGATTACCT GTGCGATGCG TTGAAGGCCG TCGGGAGCGA GTTGACCGTA 
TCGCCGCCGG ATGGCGGTAT GCAGGTGGTA GCCCGGCTCG GGCCCCTGCG CGACGATCGC 
GAGATATGCC GCCGCCTGGC CGAAGCGGGC GTGACGGCGC GCCCGCTTTC GCCCCATTAC 
TGCGCGCAAA CCGGCGCCCA AGGGCTATTC CTCGGCTTCG CGGCCTGGAA CGAATGCGAG 
ATCGACGCAG GCGTGCGGAT TCTCGCTCGC GTGATTCGCG AGCCGGAGCC ATCGAAATAG

Protein sequence

MWPRLSGNFG GGRPRAKRGA SASARCDGAG GAHRRRPARK RREGARRGES RYDYRFDRYF 
PEGYVFVKTW GQFMVETLAG LFDFEMDPQS GVALTRQLRD QLRRAIAAGS LASGRRLPSS 
RALALHLRVS RNTVCAAIEQ LAMEGYLDVS RGRRPVVAPM PSASLVAIGS DRPVSDGRSG 
MSQWAQRIDR SDWPFIGEGR PTPFAPCVAD ARAFPHAIWG RCLRTATRYA VARTSTACNR 
PGLRRALLHH LVEYRGVNAD AHQVFLMPTA QAAIALVARV LLDPGDLAWV ESPGYGGARA 
AFEAAGATVQ GIALDQSGMA FETSTDTPRL IFVTPAHQHP TGLLMPPARR QALLRFAARV 
GARIIEDDYD SEFHYEGRPV AALQGADDAD SVFYVGTFSK SLHADIRVGY VVVPGHFVDV 
FAKAQRHTGQ IVGATLQDAL AEFIDDGHYA AHIRKMTRLY HARRDYLCDA LKAVGSELTV 
SPPDGGMQVV ARLGPLRDDR EICRRLAEAG VTARPLSPHY CAQTGAQGLF LGFAAWNECE 
IDAGVRILAR VIREPEPSK