Gene BMASAVP1_A2609 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A2609
Symbol	guaD
ID	4681900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	+
Start bp	2592260
End bp	2593570
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	71%
IMG OID	639846868
Product	guanine deaminase
Protein accession	YP_993909
Protein GI	121599661
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID	[TIGR02967] guanine deaminase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.694405
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCAAA CCGCTTTCCG CGCCCGCCTG CTGAGGTTCG ACGGCGACCC CGCGCAATCG 
GACGATGCGC TCGCGTACGA CGAGGACGGC CTGCTGATCG TCGAGAACGG GCGCGTCGTC 
GCGGCGGGCG CCCATGCGGC GCTCGCCGCG CGCCTCGCGC CCGGCGCGAC GCTCGTCGAG 
ATGCGCGACA AGCTGATCGC GCCCGGCTTC ATCGACACGC ACGTGCACTA TCCGCAGACC 
GAAATGATCG CCTCGCCGGC GCCGGGCCTG TTGCCGTGGC TCGACCGCTA CACGTTCCCG 
ACCGAGCGGC GCTTCGCCGA TCCCGCGCAT GCGCGCGACG TCGCCGAGTT CTTCCTCGAT 
ACGCTGCTCG CGTGCGGCAC GACGACGGCG CTCGTCTACT GCACGGTGCA CAAGCAATCG 
GCCGACGCGC TGTTCGGCGC GAGCGAGGCG CGCGGCTTGC GGATGATCGC GGGCAAGGTG 
CTGATGGACC GCCACTGCCC CGAGTTCCTG CGCGACACCG CGCAATCGGG CTACGACGAC 
AGCGCCGAGC TGATCGCCCG CTGGCACGGC CACGGCCGGC AGTCGTACGC GCTCACGCCG 
CGCTTCGCGC CGACATCGAC GCACGCGCAG CTCGAAGCGT GCGGCGCGCT CGCCCGGCTT 
CATCCGGACG TGTTCATCCA GAGCCACGTC GCGGAGAATC TCGACGAGCT CCGCTGGGCG 
GCCGAGCTGT TTCCCGAGCG GCGCAGCTAT CTCGATGTCT ACGATCACTA CGGGCTGCTG 
CGCCGTCGCG CCGTGTACGG CCACTGCATC CATCTCGACG ACGACGACCG CCGGCGCTTC 
GCCGAAACGG GCGCGATCGC CGCGCACTGC CCGACGTCGA ACCTGTTCCT CGGCAGCGGC 
CTGTTCGATT TCGAGCGCGC GAACGCGCGG CACATGGCCG TCACGCTCGC GACCGACGTC 
GGCGGCGGCA CATCGTTCTC GATGCTCCAA ACGATGAACG AAGCGCACAA GATCGCGCGG 
ATGACGGGCC ATCACCTGAG CGCGACGCGC ATGTTCTGGC TCGCGACGGC AGGCGCCGCG 
CACGCGCTCG ATCTCGCGGA CACGATCGGC ACGCTCGCGC CGCACGCGGA AGCCGACTTC 
GTCGTGCTCG ATCCTGCCGC GACGCCGCTG CTCGCGCGCC GCACCGCGCG CGCGGAATCG 
CTCGAGGAGC TGCTGTTCGC GCTCGCGCTG CTCGGCGACG ATCGCGCGGT CTATCGCACG 
TATGCCGCCG GCCGCTGCGT GCACCGGCGC GACATCGCCG ACGCGGGCTG A

Protein sequence

MTQTAFRARL LRFDGDPAQS DDALAYDEDG LLIVENGRVV AAGAHAALAA RLAPGATLVE 
MRDKLIAPGF IDTHVHYPQT EMIASPAPGL LPWLDRYTFP TERRFADPAH ARDVAEFFLD 
TLLACGTTTA LVYCTVHKQS ADALFGASEA RGLRMIAGKV LMDRHCPEFL RDTAQSGYDD 
SAELIARWHG HGRQSYALTP RFAPTSTHAQ LEACGALARL HPDVFIQSHV AENLDELRWA 
AELFPERRSY LDVYDHYGLL RRRAVYGHCI HLDDDDRRRF AETGAIAAHC PTSNLFLGSG 
LFDFERANAR HMAVTLATDV GGGTSFSMLQ TMNEAHKIAR MTGHHLSATR MFWLATAGAA 
HALDLADTIG TLAPHAEADF VVLDPAATPL LARRTARAES LEELLFALAL LGDDRAVYRT 
YAAGRCVHRR DIADAG