Gene BURPS668_A2503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2503
Symbol
ID	4885886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	+
Start bp	2417373
End bp	2418893
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	69%
IMG OID	640132440
Product	GntR family transcriptional regulator
Protein accession	YP_001063497
Protein GI	126444443
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATCCTCT CCGACTGGCT TGCCGCGCGA CTCGAGCGGC ACTCGGCCGA GCCGATGTAC 
CGGCAACTGC TGCGGCTGAT GCAGCAGGCG ATCCTCTCGG GGGAGCTCAC GCCCGGCACG 
AAGCTGCCGA GCTCGCGCAC GCTCGCCACC GATCTCGCGA TCGCGCGCAA CACCGTGCTG 
CACGTGTACG ACCAACTGAC GACGGAAGGC TACGTGCTGA CGACGACGGG CAGCGGCACC 
TACGTCGCCG ACACGCGCCC CGATGCCGCG GCGATGCGCG CGCAAGCCGG CGCGCCCGCG 
CATCCGTCAG ACGAAACGCG CGACGCGCAG CAGCGCGCGC ACGGCGCACT GTCGGCGCGC 
GGCGCGCAAC TGATCCGGCA CGCGGGCGTG TCGCGCCGCC AGTGGGGCGC GTTCATGCCG 
GGCGTGCCCG ACGTGTCCGA GTTTCCGACG CGTACATGGA GCCGCCTGCA GGCGCGGCTG 
TGGAAGGAAG CGAATCCGGA GCTGCTGACC TATGCGCCGG GCGGCGGCTA CCGGCCGTTG 
CGGCGCGCGC TGTCCGACTA CCTGCGTGTC GCGCGCTCGG TCAAATGCTC GCCCGATCAG 
ATCATCATCA CGACGGGCAT TCATCAGTCG ATCGACCTGT CGGTGCGCCT GCTCGCCGAC 
GTCGGCGATC GCGCGTGGGT CGAGGAGCCG TGCTACTGGG GCGTGCGCAG CGTGCTGCAG 
GCGGCGGGGC TCGCACTCGC GCCCGTGCCC GTCGATCAGG AAGGGCTCGC GCCGCGCGCG 
CAGGACCTGA AGCGCCCGCC GCGGCTCGTG CTCGTCACGC CATCGCATCA ATATCCGCTC 
GGCATGGTGA TGAGCCTCGC GCGGCGCCGG ATGCTGCTCG AATATGCGCG GCAGCATCAA 
TGCTGGATCA TCGAAGACGA CTACGACAGC GAGTTCCGCT ACGGCAGCCG TCCGCTCGCG 
TCGCTACAGG GGCTCGACGA CGCGGGCCGC GTGATCTACG TCGGCAGTCT CGGCAAGATG 
CTGTTCCCGA GCCTGCGCCT CGGCTACATG GTCGTGCCCG AGCACCTCGT CGAGACCTTC 
CGGACCGGGC TGTCGGAGCT GTATCGCGAA GGGCAACTGA TGCAGCAGGC GGTGCTCGCC 
GAATTCATCA TGGACGGCTA TCTGACGTCG CACGTGCGCC GGATGCGCGC GCTGTACGGC 
GAGCGCCGCC AGTTGCTGAT CGACGCGATC CACGCGCGCT TCGGCGATGC GCTGCCGGTG 
ATGGGCGACG AGGCGGGCCT GCACCTCGTG ATCGGATTGC CGAACGGCTG CGACGACCGG 
GCGATCACGC AGACCGCATT CGACGCGGGG GTGATCGTGC GCCCGCTCAC GACGTACTAC 
AACCATGCGG ATACCGCGCG CGAGGGATTG CTGCTCGGCT ACGCATGCGT GCCGAACGAG 
CGCATCGCGC CCGCGTTCGA TACGCTCGCG CAGATAATCG AAGCGCATCT GAATCGGCGT 
GCGAAGCAAC GGGCCGCGTG A

Protein sequence

MILSDWLAAR LERHSAEPMY RQLLRLMQQA ILSGELTPGT KLPSSRTLAT DLAIARNTVL 
HVYDQLTTEG YVLTTTGSGT YVADTRPDAA AMRAQAGAPA HPSDETRDAQ QRAHGALSAR 
GAQLIRHAGV SRRQWGAFMP GVPDVSEFPT RTWSRLQARL WKEANPELLT YAPGGGYRPL 
RRALSDYLRV ARSVKCSPDQ IIITTGIHQS IDLSVRLLAD VGDRAWVEEP CYWGVRSVLQ 
AAGLALAPVP VDQEGLAPRA QDLKRPPRLV LVTPSHQYPL GMVMSLARRR MLLEYARQHQ 
CWIIEDDYDS EFRYGSRPLA SLQGLDDAGR VIYVGSLGKM LFPSLRLGYM VVPEHLVETF 
RTGLSELYRE GQLMQQAVLA EFIMDGYLTS HVRRMRALYG ERRQLLIDAI HARFGDALPV 
MGDEAGLHLV IGLPNGCDDR AITQTAFDAG VIVRPLTTYY NHADTAREGL LLGYACVPNE 
RIAPAFDTLA QIIEAHLNRR AKQRAA