Gene BMASAVP1_A1074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BMASAVP1_A1074
Symbol	purD
ID	4679718
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia mallei SAVP1
Kingdom	Bacteria
Replicon accession	NC_008785
Strand	-
Start bp	1056854
End bp	1058131
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	68%
IMG OID	639845348
Product	phosphoribosylamine--glycine ligase
Protein accession	YP_992414
Protein GI	121600230
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0151] Phosphoribosylamine-glycine ligase
TIGRFAM ID	[TIGR00877] phosphoribosylamine--glycine ligase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.497421
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTAC TCGTCGTCGG CTCCGGCGGC CGCGAACATG CGCTCGCCTG GAAGCTCGCC 
CAGTCGCCGC GCGTCCAGCT CGTCTACGTT GCGCCCGGCA ACGGCGGCAC CGCGCAGGAC 
GAGCGCCTGA AGAACGTCGA TCTGAGCTCG CTCGACGATC TGGCCGATTT CGCCGAATCC 
GAAGGCGTCG CGTTCACGCT CGTCGGCCCG GAAGCGCCGC TCGCGGCGGG CATCGTCAAT 
CATTTCCGCG CGCGCGGCCT GAAGATCTTC GGCCCGACGA AGGAAGCGGC GCAGCTCGAG 
AGCTCGAAGG ACTTCGCGAA GGCGTTCATG AAGCGCCACG GCATTCCGAC CGCCGATTAC 
GAGACGTTCA CCGACGCGGC CGCCGCGCAC GCGTACGTCG ATTCGAAAGG CGCGCCGATC 
GTCGTGAAGG CGGACGGCCT CGCCGCGGGC AAGGGCGTCG TCGTCGCGAT GACGCTGGAA 
GAAGCGCACG CGGCCGTCGA CATGATGCTG TCCGGCAACA AGCTCGGCGA TGCCGGCGCG 
CGCGTCGTGA TCGAGGCATT CCTCGACGGC GAGGAAGCGA GCTTCATCGT GATGGTCGAC 
GGCAAGCACG CGCTCGCGCT CGCGTCGAGC CAGGATCACA AGCGTCTGCT CGACGAGGAC 
CGCGGCCCGA ACACGGGCGG CATGGGCGCG TACTCGCCGG CGCCGATCGT CACGCCGCAG 
ATGCATGCGC GCGTGATGCG CGAGATCATC ATGCCGACCG TGCGCGGGAT GGAGAAGGAC 
GGCATCCGCT TCACGGGCTT CCTGTACGCG GGCCTGATGA TCGACCGCGA CGGCAATCCG 
CGCACGCTCG AATTCAACTG CCGGATGGGC GACCCCGAAA CGCAGCCGAT CATGGCGCGC 
CTGAAGAGCG ATTTCTCGAA GGTCGTCGAG CAGGCGATCG CGGGCACGCT CGATACCGTC 
GAGCTCGACT GGGACCGCCG CACGGCGCTC GGCGTCGTGC TCGCCGCGCA CGGCTACCCC 
GATGCGCCGC GCAAGGGCGA CCGGATCAAC GGCATCCCGG CCGGAACGGC GCACGCGGTG 
ACGTTCCACG CGGGCACGAC GTTCGACGGC GACAAGCTCG TCACCTCGGG CGGGCGCGTG 
CTGTGCGTGG TCGGCCTCGC GGATTCGGTG CGCGGCGCGC AGCAGGCCGC GTACGAGACG 
ATCAACCAGA TCAACTTCGA AGGCATGCAG TATCGCCGCG ACATCGGCTA CCGCGCGCTC 
AACCGCAAGA CGGTCTGA

Protein sequence

MKLLVVGSGG REHALAWKLA QSPRVQLVYV APGNGGTAQD ERLKNVDLSS LDDLADFAES 
EGVAFTLVGP EAPLAAGIVN HFRARGLKIF GPTKEAAQLE SSKDFAKAFM KRHGIPTADY 
ETFTDAAAAH AYVDSKGAPI VVKADGLAAG KGVVVAMTLE EAHAAVDMML SGNKLGDAGA 
RVVIEAFLDG EEASFIVMVD GKHALALASS QDHKRLLDED RGPNTGGMGA YSPAPIVTPQ 
MHARVMREII MPTVRGMEKD GIRFTGFLYA GLMIDRDGNP RTLEFNCRMG DPETQPIMAR 
LKSDFSKVVE QAIAGTLDTV ELDWDRRTAL GVVLAAHGYP DAPRKGDRIN GIPAGTAHAV 
TFHAGTTFDG DKLVTSGGRV LCVVGLADSV RGAQQAAYET INQINFEGMQ YRRDIGYRAL 
NRKTV