Gene YpAngola_A3120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3120
Symbol	purM
ID	5801594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	-
Start bp	3307987
End bp	3309030
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	52%
IMG OID	641340954
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_001607482
Protein GI	162419605
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCAACA AAACCTCTCT CAGTTATAAA GACGCAGGTG TAGATATTGA TGCCGGCAAT 
GACCTTGTTG ATCGCATAAA AGGTGTGGTT AAACAAACCC GTCGACCAGA AGTCATGGGC 
GGATTAGGAG GGTTCGGTGC CCTGTGCGCG TTGCCGCAAA AATACCGTGA ACCTATTCTG 
GTTTCAGGCA CGGATGGCGT CGGCACCAAG CTGCGTCTGG CGATGGACCT GAAACGTCAC 
GATACTATCG GTATCGATTT AGTCGCGATG TGTGTCAACG ATCTGGTGGT TCAGGGCGCA 
GAGCCGCTGT TCTTCCTCGA CTACTTTGCG ACCGGTAAAC TGGATGTGGA TACTGCCGCC 
AGTGTGATTA CCGGGATTGC CGAAGGCTGT AAACAATCAG GTTGTGCGTT GGTTGGCGGT 
GAAACCGCAG AAATGCCGGG CATGTACCAC GGCGATGATT ATGACGTTGC TGGCTTCTGT 
GTGGGTGTCG TAGAGAAATC TGAAATCATT GATGGCAGTA AAGTTACACC AGGTGATGTC 
TTGGTCGCCT TAGGTGCTAG CGGCCCACAC TCCAATGGTT ATTCATTGGT GCGCAAAATT 
CTGGACGTCA GCAACACCAA TCCAGAACAG ACCTCGTTGG AAGGCAAATC TCTGGCCGAT 
CATTTGCTAG AACCGACCAA AATCTATGTG AAATCCATTC TCAGCCTGAT TGAACAGTTA 
GATATCCACG CCATTGCGCA TCTGACCGGT GGTGGCTTCT GGGAAAATAT CCCGCGCGTG 
CTACCGCAAG GCATGCAAGC CGTTATCGAC GAAGCCAGTT GGCAGTGGCC AGCGGTATTC 
AGTTGGCTGC AACAAGCTGG CAATGTCAGC CGCCATGAGA TGTACCGCAC CTTTAACTGT 
GGCGTCGGTA TGGTTGTTGC CTTGCCTGCA GAACTGGCAG ATAAAGCGGT TGAGTTGCTG 
ACAGCTTCTG GCGAAAAAGC CTGGAAAATC GGTGTCATTG CCGCGGCAAC TGAGGGTGCT 
GAGCAAGTCA TCATTAATCC GTAA

Protein sequence

MTNKTSLSYK DAGVDIDAGN DLVDRIKGVV KQTRRPEVMG GLGGFGALCA LPQKYREPIL 
VSGTDGVGTK LRLAMDLKRH DTIGIDLVAM CVNDLVVQGA EPLFFLDYFA TGKLDVDTAA 
SVITGIAEGC KQSGCALVGG ETAEMPGMYH GDDYDVAGFC VGVVEKSEII DGSKVTPGDV 
LVALGASGPH SNGYSLVRKI LDVSNTNPEQ TSLEGKSLAD HLLEPTKIYV KSILSLIEQL 
DIHAIAHLTG GGFWENIPRV LPQGMQAVID EASWQWPAVF SWLQQAGNVS RHEMYRTFNC 
GVGMVVALPA ELADKAVELL TASGEKAWKI GVIAAATEGA EQVIINP