Gene BURPS668_0839 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_0839
Symbol	purK
ID	4881810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	816438
End bp	817634
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	72%
IMG OID	640126767
Product	phosphoribosylaminoimidazole carboxylase ATPase subunit
Protein accession	YP_001057890
Protein GI	126441524
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGCAC TCCCCACCCC GAATTCCCCG ATCCTGCCGG GCGCCTGGCT CGGCATGGTC 
GGCGGCGGCC AGCTCGGCCG CATGTTCTGC TTTGCCGCGC AAGCGATGGG CTACCGCGTC 
GCCGTGCTCG ATCCCGATCC GACGAGCCCC GCGGGCGCCG TCGCCGACAA GCATCTGCGC 
GCCGCGTACG ACGACGAGGC CGCGCTCGCC GAGCTCGCGC AATTGTGCGA TGCCGTATCG 
ACCGAATTCG AGAACGTGCC CGCCGCGAGC CTCGAGCTGC TCGCGCAATC GACGTTCGTC 
GCGCCGGCCG GCCGGTGCGT CGCGATCGCG CAGGACCGGA TCGCCGAGAA ACGATTCATC 
GCGGCGTCGG GCGTGCCCGT CGCGCCGCAC GTCGTGATCG AATCGCACGC GCAGCTCGCC 
GCGCTCGCCG ATGCGGACCT CGCCGCGGTG CTGCCCGGCA TCCTGAAGAC CGCGCGTCTC 
GGTTACGACG GCAAGGGGCA GGTGCGTGTC GCGACGGTGC GCGAGGCGCG CGACGCGTAC 
GCGTCGCTCG GCGGCGTGCC TTGCGTGCTC GAGAAGCGCC TGCCGCTCGA ATACGAGGTG 
TCGGCGCTGA TCGCGCGCGG CGCGAACGGC GCGTCGGCGG TGTTTCCGCT CGCGCAGAAC 
ACGCACCACG GCGGCATCCT GTCGCTGAGC GTCGTGCCCG CGCCCGCCGC GAGCGATGCG 
CTCGTGCGCG AAGCGCAGCA GGCGGCCGTG CGGATCGCCG ATTCGCTCGG CTACGTCGGC 
GTGCTGTGCG TCGAGTTCTT CGTGCTCGAA GACGGCTCGC TCGTCGCGAA CGAAATGGCG 
CCGCGCCCGC ACAACTCCGG CCATTACACG GTCGACGCGT GCGAGACGAG CCAGTTCGAG 
CAGCAGGTGC GCGCGATGAC GCGGCTGCCG CTCGGCAGCA CGCGCCAGCA TTCGCCCGCC 
GCGATGCTCA ACGTGCTCGG CGACGTGTGG TTCGCGAACG GCGTGTCGGG TGAGCCCGTC 
ACGCCGCCGT GGGACGAGGT CGCCGCAATG CCGACCGCGC GGCTGCATCT GTACGGCAAG 
GAAGAGGCGC GCGCCGGCCG CAAGATGGGC CATGTGAACT TCACCGCGGC GACGCGCGAC 
GAAGCGGTCG CCGGCGCGAC CGCGTGCGCG CGGCTGTTGC GCATTGCGCT CGACTGA

Protein sequence

MTALPTPNSP ILPGAWLGMV GGGQLGRMFC FAAQAMGYRV AVLDPDPTSP AGAVADKHLR 
AAYDDEAALA ELAQLCDAVS TEFENVPAAS LELLAQSTFV APAGRCVAIA QDRIAEKRFI 
AASGVPVAPH VVIESHAQLA ALADADLAAV LPGILKTARL GYDGKGQVRV ATVREARDAY 
ASLGGVPCVL EKRLPLEYEV SALIARGANG ASAVFPLAQN THHGGILSLS VVPAPAASDA 
LVREAQQAAV RIADSLGYVG VLCVEFFVLE DGSLVANEMA PRPHNSGHYT VDACETSQFE 
QQVRAMTRLP LGSTRQHSPA AMLNVLGDVW FANGVSGEPV TPPWDEVAAM PTARLHLYGK 
EEARAGRKMG HVNFTAATRD EAVAGATACA RLLRIALD