Gene WD1024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	WD1024
Symbol	purM
ID	2738042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Wolbachia endosymbiont of Drosophila melanogaster
Kingdom	Bacteria
Replicon accession	NC_002978
Strand	-
Start bp	985655
End bp	986692
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	35%
IMG OID	637173180
Product	phosphoribosylaminoimidazole synthetase
Protein accession	NP_966749
Protein GI	42520834
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATACTT ATACCAGATC AGGAATAGAT ATTGAACTAT ATAATAAGTT AATAAAAGAA 
GTCAAGCCTA TTGCTCAAGA AACTACTAGA GAAGAAGTAA TCAGCGAAAT AGGTTCATTT 
TCTGCGTTAT TTGATTTTGC TGCACTAAGT AAGAAGTATG ACCATCCAGT ACTCGTTTCC 
TCAACTGATG GAGTAGGTAC GAAACTGTTG ATAGCTCAAG AAGTGAATAA ACATGATACT 
ATAGGTATAG ATTTAGTTGC AATGTGTGTA AATGACTTAC TTGCACAAGG AGCAACGCCT 
TTGTTTTTCC TTGATTACTT TGCAACAGGC GTTTTGACCA AAGATGTTTT ATTATCTGTG 
GTTAAGGGCA TTGCAGAGGG GTGCAAGCAA GCTAAAATAG CATTGGTTGG TGGGGAAACT 
GCAGAAATGC CTGGAATGTA TGGTAATAAT CACTATGACC TTGCAGGGTT TGTGGTTGGT 
GTAGTTGATC GAAAGCAAAT TCTTCCAAAC TGTAGTATGA TGAAAGCAGG TGATTATATA 
GTTGGCTTAG AGTCAAGTGG AATTCACTCA AATGGGTTTT CTTTAGTGCG CCATGTTTTC 
AAAAGCTTAG GTATAAATTA TAACGATACA TCTCTATGGA ATAATAAATC TTGGAGTGAA 
ATACTACTTG AACCAACAAA AATATATGTT GATTCTTTGC TGCCTATCAT GTCACAAGTA 
AAAGGTATTG CGCACATCAC GGGTGGTGGT TTGGTAGACA ATATTCCGCG AATTCTTCCA 
AAAAACTTAT TTGCAAACAT AGACATTAAT TCCTGGAAAT GGCCAGATAT ATTTTTATGG 
CTAACAAAGG AGGGTAAAAT AGAGAAGAAA GAAATGCTAA AAACATTTAA TTGTGGTATT 
GGTATGGTAT TGATCGTAAG TTCTGAGAAT ATGCAAAACG TGAAAAATCA TTTCCAAAAA 
CGTGGAGAAA AAATTGAAAT TATTGGAAAA CTTGATGAGG CATGTAACTC TCCACTTGAT 
AGAGTAGTAT TTAGTTAA

Protein sequence

MNTYTRSGID IELYNKLIKE VKPIAQETTR EEVISEIGSF SALFDFAALS KKYDHPVLVS 
STDGVGTKLL IAQEVNKHDT IGIDLVAMCV NDLLAQGATP LFFLDYFATG VLTKDVLLSV 
VKGIAEGCKQ AKIALVGGET AEMPGMYGNN HYDLAGFVVG VVDRKQILPN CSMMKAGDYI 
VGLESSGIHS NGFSLVRHVF KSLGINYNDT SLWNNKSWSE ILLEPTKIYV DSLLPIMSQV 
KGIAHITGGG LVDNIPRILP KNLFANIDIN SWKWPDIFLW LTKEGKIEKK EMLKTFNCGI 
GMVLIVSSEN MQNVKNHFQK RGEKIEIIGK LDEACNSPLD RVVFS