Gene BURPS1106A_0842 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_0842
Symbol	purC
ID	4901865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	823001
End bp	823891
Gene Length	891 bp
Protein Length	296 aa
Translation table	11
GC content	66%
IMG OID	640134072
Product	phosphoribosylaminoimidazole-succinocarboxamide synthase
Protein accession	YP_001065123
Protein GI	126455088
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0152] Phosphoribosylaminoimidazolesuccinocarboxamide (SAICAR) synthase
TIGRFAM ID	[TIGR00081] phosphoribosylaminoimidazole-succinocarboxamide synthase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.818868
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTACCC TTTACGAATC CACGCTGCGC TCGCTGCCGC TCCTCGGTCG CGGCAAGGTC 
CGCGACAACT ACGCGCTCGG CAACGACAAG CTCCTGATCG TCACGACCGA TCGCCTGTCG 
GCGTTCGACG TCATCATGGG CGAGCCGATT CCGAACAAGG GCCGCGTGCT GAACCAGATG 
GCGAACTTCT GGTTCGACAG GCTCGCGCAC ATCGTCCCGA ACCATCTGAC GGGCGTCGCG 
CCCGAGACGG TCGTCGCCGC CGACGAGGTC GAGCAGGTGA AGGGGCGCGC GGTCGTCGTC 
AAGCGGCTCG AGCCGATCCT CGTCGAGGCG GTCGTGCGCG GCTATCTGGC GGGCAGCGGC 
TGGAAGGACT ACCAGGCGAC GGGCAAGGTG TGCGGCGTCG AGCTGCCGGC CGGCCTGTCG 
AACGCGCAGA AGCTCCCCGA GCCGATCTTC ACGCCCGCCG CGAAGGCCGA GATGGGCCAT 
CACGACGAGA ACATCTCGTT CGAGGAAACC GAGCGGCGCA TCGGCACCGA GCTCGCCGCG 
ACGATTCGCG ACATCTCGAT CAGGCTGTAC AAGGAAGCGG CCGATTACGC GGCGACGCGC 
GGCATCATCA TCGCCGACAC GAAGTTCGAG TTCGGCCTCG ACGAGCACGG CGAGCTGTTC 
CTGATGGACG AGGCGTTGAC GGCCGATTCG TCGCGCTTCT GGCCGGCGGA CGAATACCGG 
GTCGGCACGA ACCCGCCGTC GTTCGACAAG CAGTTCGTCC GCGACTGGCT CGAGGCGCAG 
AACTGGAACA AGGCGCCGCC CGCGCCGAAG CTGCCCGACG ATGTGGTCGC GAAGACGAGC 
GCGAAGTATC AGGAAGCGCT CGAGCGCATC ACGGGCAAGA CGCTCGACTG A

Protein sequence

MSTLYESTLR SLPLLGRGKV RDNYALGNDK LLIVTTDRLS AFDVIMGEPI PNKGRVLNQM 
ANFWFDRLAH IVPNHLTGVA PETVVAADEV EQVKGRAVVV KRLEPILVEA VVRGYLAGSG 
WKDYQATGKV CGVELPAGLS NAQKLPEPIF TPAAKAEMGH HDENISFEET ERRIGTELAA 
TIRDISIRLY KEAADYAATR GIIIADTKFE FGLDEHGELF LMDEALTADS SRFWPADEYR 
VGTNPPSFDK QFVRDWLEAQ NWNKAPPAPK LPDDVVAKTS AKYQEALERI TGKTLD