Gene YpsIP31758_3844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_3844
Symbol	purD
ID	5385221
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	4331184
End bp	4332470
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	52%
IMG OID	640866869
Product	phosphoribosylamine--glycine ligase
Protein accession	YP_001402795
Protein GI	153950785
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0151] Phosphoribosylamine-glycine ligase
TIGRFAM ID	[TIGR00877] phosphoribosylamine--glycine ligase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.000315171
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATATTT TGATAATTGG TAACGGCGGT CGTGAACACG CTCTGGGCTG GAAAGCCGCC 
CAATCTCCTT TAGCGGACAA AATTTATGTT GCACCAGGTA ATGCGGGTAC AGCACTGGAA 
CCGACCTTAG AAAATGTTGA TATCGCCGCC ACTGATATTG CCGGTTTACT GGCCTTTGCT 
CAAAGTCATG ATATCGGCCT GACGATTGTT GGCCCAGAAG CCCCTTTGGT GATCGGCGTG 
GTTGATGCGT TCCGCGCTGC TGGTTTAGCT ATTTTTGGCC CGACTCAGGC TGCGGCTCAA 
TTAGAGGGTT CTAAAGCCTT CACCAAAGAT TTCCTGGCCC GTCACAACAT TCCCTCTGCG 
GAATACCAAA ACTTTACAGA TGTCGAGGCC GCATTGGCCT ATGTGCGTCA AAAAGGTGCG 
CCAATCGTTA TCAAAGCCGA TGGTCTGGCC GCCGGTAAAG GCGTGATTGT TGCGATGACG 
CAGGAAGAAG CCGAAACCGC CGTGAATGAT ATGTTGGCCG GTAACGCTTT TGGTGATGCA 
GGGCACCGTA TCGTGGTGGA AGAGTTCCTT GATGGCGAAG AAGCCAGCTT TATCGTGATG 
GTTGATGGCG AAAATGTTTT GCCAATGGCG ACCAGTCAGG ATCATAAGCG AGTTGGCGAT 
GGTGATACCG GGCCAAATAC CGGCGGAATG GGTGCTTATT CCCCAGCCCC CGTGGTAACA 
GATGATGTTC ACCAACGGGT CATGGATCAG GTTATTTGGC CGACCGTGCG TGGTATGGCG 
GCGGAAGGTA ATATTTACAC CGGTTTCCTC TATGCTGGCC TGATGATTTC AGCCGATGGG 
CAACCCAAAG TCATTGAGTT CAACTGCCGC TTTGGCGATC CAGAAACGCA GCCAATCATG 
TTGCGTATGC GCTCCGATTT GGTCGAACTG TGTTTAGCCG GTACACAAGG CAAACTAAAT 
GAAAAAACCT CAGACTGGGA TGAGCGCCCA TCACTGGGGG TCGTTTTAGC CGCTGGCGGT 
TATCCAGCAG ATTACCGCCA GGGTGATGTT ATTCATGGCT TACCACAGCA AGAAGTCAAG 
GATGGAAAAG TCTTCCACGC GGGGACCAAG CTGAATGGGA ATCATGAAGT TGTCACCAAT 
GGTGGCCGCG TCTTGTGTGT CACTGCACTC GGTGAAACCG TCGCGCAGGC GCAACAATAT 
GCCTATCAGT TAGCTGAGGG GATCCAGTGG GAAGGGGTTT TCTGCCGTAA AGATATTGGT 
TATCGAGCGA TTGCTCGCGG TAAGTAA

Protein sequence

MNILIIGNGG REHALGWKAA QSPLADKIYV APGNAGTALE PTLENVDIAA TDIAGLLAFA 
QSHDIGLTIV GPEAPLVIGV VDAFRAAGLA IFGPTQAAAQ LEGSKAFTKD FLARHNIPSA 
EYQNFTDVEA ALAYVRQKGA PIVIKADGLA AGKGVIVAMT QEEAETAVND MLAGNAFGDA 
GHRIVVEEFL DGEEASFIVM VDGENVLPMA TSQDHKRVGD GDTGPNTGGM GAYSPAPVVT 
DDVHQRVMDQ VIWPTVRGMA AEGNIYTGFL YAGLMISADG QPKVIEFNCR FGDPETQPIM 
LRMRSDLVEL CLAGTQGKLN EKTSDWDERP SLGVVLAAGG YPADYRQGDV IHGLPQQEVK 
DGKVFHAGTK LNGNHEVVTN GGRVLCVTAL GETVAQAQQY AYQLAEGIQW EGVFCRKDIG 
YRAIARGK