Gene SeD_A2868 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2868
Symbol	purM
ID	6872512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	2742009
End bp	2743046
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	56%
IMG OID	642785919
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_002216569
Protein GI	198243577
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	78
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGATA AGACCTCTCT TAGCTATAAA GATGCCGGCG TCGATATTGA TGCGGGTAAC 
GCTCTGGTTG ATCGAATCAA AGGCGTAGTG AAGAAAACTC GCCGCCCGGA GGTTATGGGC 
GGTCTGGGCG GTTTCGGTGC GCTGTGCGCG TTGCCGCAAA AATATCGTGA ACCGGTACTG 
GTTTCCGGCA CTGACGGCGT AGGCACCAAA CTTCGCCTGG CGATGGACTT AAAGCGCCAC 
GACGCTATCG GTATTGATCT GGTGGCAATG TGCGTAAACG ATCTGGTCGT TCAGGGCGCG 
GAACCGCTGT TTTTCCTCGA TTACTATGCC ACGGGTAAAC TGGATGTCGA TACCGCCGCC 
AGCGTGATCA ACGGTATTGC CGAAGGCTGC CTGCAATCCG GCTGCGCGCT GGTCGGCGGC 
GAGACGGCGG AAATGCCGGG CATGTATCAC GGCGAAGATT ACGATGTGGC GGGTTTCTGC 
GTCGGCGTAG TCGAAAAATC AGAAATCATC GACGGCTCCC GGGTTGCCGA AGGCGACGTG 
CTGATTGCGC TCGGCTCCAG CGGCCCGCAC TCGAATGGAT ATTCGCTGGT GCGGAAAATT 
ATTGACGTTA GCGGCTGCGA CCCACAAACC ACTCTGCTGG AAGGGAAGCC GCTGGCCGAT 
CATCTGCTTG AACCGACCCG TATCTACGTA AAATCGGTTC TGGAACTGAT TGAAAACGTC 
GATGTGCACG CTATCGCCCA CCTCACCGGC GGCGGCTTTT GGGAAAATAT TCCGCGCGTT 
CTGCCGGAGA ATACCCAGGC GGTAATTAAT GAGTCGTCAT GGCAGTGGCC CGCCATCTTT 
ACCTGGCTGC AAACCGCCGG TAATGTCAGC CGACATGAAA TGTACCGTAC CTTTAACTGC 
GGCGTCGGCA TGGTGATTGC GCTCTCCGCT CCGGAAGCGG ACAAAGCGCT TGCTCTGCTA 
AACGAGAAAG GTGAAAACGC ATGGAAAATC GGTATCATCA AAGCCTCTGA TTCCGAACAG 
CGTGTGGTTA TTGAATAA

Protein sequence

MTDKTSLSYK DAGVDIDAGN ALVDRIKGVV KKTRRPEVMG GLGGFGALCA LPQKYREPVL 
VSGTDGVGTK LRLAMDLKRH DAIGIDLVAM CVNDLVVQGA EPLFFLDYYA TGKLDVDTAA 
SVINGIAEGC LQSGCALVGG ETAEMPGMYH GEDYDVAGFC VGVVEKSEII DGSRVAEGDV 
LIALGSSGPH SNGYSLVRKI IDVSGCDPQT TLLEGKPLAD HLLEPTRIYV KSVLELIENV 
DVHAIAHLTG GGFWENIPRV LPENTQAVIN ESSWQWPAIF TWLQTAGNVS RHEMYRTFNC 
GVGMVIALSA PEADKALALL NEKGENAWKI GIIKASDSEQ RVVIE