Gene BURPS668_A0287 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A0287
Symbol
ID	4887701
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	253071
End bp	254321
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	72%
IMG OID	640130228
Product	transcription regulator ROK family protein
Protein accession	YP_001061293
Protein GI	126444113
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGAGTC CGCACCTCGG CCAGGGCAGC AACTCGGCCA ACGTGCGCCG CTACAACGAG 
CGCCTCCTGC TGAAGACGCT CAGGCGCGCG GGCAGCGCAT CGAAGGCCGA TCTGGCCCGG 
CTCGCCAACC TGACGGGCAC CGCGGTCGGC AGCATCATCG CGTCGCTCGC TGAAGCGAAG 
CTGATCGAAT TCGCCGGCCG CCGCGCCGAA GGCCAGCGTG GCCAGCCCGC ATCGCTGATC 
CGGCTCGATC CGCGCGGCGC GTTCGGCATC GGCGTGCGGC TCGACCGGAT GCGCATCGAG 
ACGGCGCTCG TGAACTTCGC CGGCGACGTG ATCGGCCGCC GCTCGCACGA CACGCTGCTG 
CCGCAGCCGG CCGCCGTGCT CGAGATCGTC CGGGAGGACG TCGCCGCGAT GCAGCAACTG 
CTTTGCGCGC ACGAGCGCGC ACGGCTCACG GGCGTCGGCG TCGCGCAGCC GTACAACCTC 
GGCAGCTGGC TGCGCGAGAT CGACCTGCCC GCCGACGCGT TCGGCGCATG GGCCGAAGTC 
GATTTCGCGC GCGAGCTCGA TCGCGCGATC GAGCTGCCCG TCTTCAGCGA AAACGACGGC 
AACGCGGCCG CGATCGCCGA GCTGTTCTAC GGCTGCGGCC GGCAGCGCGA CGATTTCGTC 
TACCTGTTCC TCGGGCCCGC GATCGGCGGC GGCATCGCGG TGGACGGCGA CTGCCTGCGC 
GGCGTCACCG GCAACGCCGG CGACTTCGCG ATGATGCCGG TGCCGCCGAG CCGGCTGCCC 
TCGGTGCCGA AGCCGAGCGG CGCATGGGAT CTGCTGATCA CGCGCGCGTC GCTGAACGGG 
CTCGCGCGGC ATCTGCGCCA CCGCGGCGAA ACGCTCGAGA GCCACGCGGA TCTCGAGGCA 
TGCATCGCGC GCGGCGGGCA AGCCGTCGAC GAATGGATCG ACGATTGCGT CGACGCGCTC 
GCACCCGCGC TGCGCGCGGT GCTCGCGGTG CTCGAATCGC CCGTCGTCGT GCTCGATGCG 
GATACCGACG CGGGCCTGAT CGACACGCTG ATCGCGCGCC TGCACACGGC GCTCGCGGCG 
CTCGCGCCCG AGGCGCGCGG CACGCCCGTG CTCGTGCGCG GCACGTTCGG CCCGGACGCT 
GGCGCGATCG GCGCGGCGAC GCTGCCGATG TTCTTCAACT TCTCGCCGCG CGCCGGCATT 
CTTCGCGGCG CGGGCGTGGA TTCGCAGGAG GCCCGATATG CAGCGTTCTG A

Protein sequence

MRSPHLGQGS NSANVRRYNE RLLLKTLRRA GSASKADLAR LANLTGTAVG SIIASLAEAK 
LIEFAGRRAE GQRGQPASLI RLDPRGAFGI GVRLDRMRIE TALVNFAGDV IGRRSHDTLL 
PQPAAVLEIV REDVAAMQQL LCAHERARLT GVGVAQPYNL GSWLREIDLP ADAFGAWAEV 
DFARELDRAI ELPVFSENDG NAAAIAELFY GCGRQRDDFV YLFLGPAIGG GIAVDGDCLR 
GVTGNAGDFA MMPVPPSRLP SVPKPSGAWD LLITRASLNG LARHLRHRGE TLESHADLEA 
CIARGGQAVD EWIDDCVDAL APALRAVLAV LESPVVVLDA DTDAGLIDTL IARLHTALAA 
LAPEARGTPV LVRGTFGPDA GAIGAATLPM FFNFSPRAGI LRGAGVDSQE ARYAAF