Gene YpsIP31758_2555 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_2555
Symbol	pyrD
ID	5384876
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	2891132
End bp	2892142
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	43%
IMG OID	640865544
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_001401520
Protein GI	153948054
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	0.982288
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATTATC CACTTGTCAG AAAAGCACTA TTTCAGCTTG ATCCAGAACG TGCCCATGAA 
TTGACTTTTC GTCAGTTAAA GCGTGTTAGC GGCACACCTT TGGAATTTTT GGTACGCCAG 
TCGGTACCCA CCAAACCGGT CAGTTGTATG GGCCTGTCTT TTAAAAATCC AGTAGGTTTG 
GCTGCGGGCC TGGATAAAGA CGGTGAGTGT ATTGATGCCT TGGGCGCCAT GGGCTTTGGT 
TTCATTGAAG TGGGCACTGT GACACCACGG CCTCAGGTGG GGAATGATAA GCCGAGATTA 
TTCAGGATCG TCGAAGCTGA AGGTTTGATC AACCGTATGG GGTTTAATAA TCATGGGGTC 
GACAACCTTA TTGAAAATGT TAAAAAATCC CATTTTGGCG GTATATTGGG CATTAATATC 
GGCAAGAATA AAGATACGCC AGTCGAACAA GGTAAAGAAG ATTATCTGAT TTGCATGGAT 
AAAATTTATC CTTATGCTGG ATATATTGCG ATTAATATTT CCTCACCTAA TACACCGGGG 
TTACGATCCT TACAGTACGG TGAAGCATTA GATGATTTGT TAGCTGCAAT TAAAGATAAA 
CAAACTGAGC TACATCAACG CCATCATAAG TATGTTCCCG TAGCGGTGAA GATCGCGCCG 
GATCTTACTG AAGAGGAATT GATCCAAATA GCAGATAGTT TGGTCCGCCA TAATATTGAT 
GGCGTTATTG CTACTAATAC GACTTTAGAT CGTTCTCTGA TTCAGGGATT AAATTATTGC 
GAGCAAGCCG GTGGATTAAG TGGCCGCCCA TTACAATTAC GCAGTACTGA GGTTATTCAT 
CGTTTATCAC AAGAGCTAAA AGGGCGCCTG CCTATTATCG GTGTTGGTGG TATTGATTCC 
GTTACTGCAG CACGGGAAAA GATGGCGGCT GGTGCTTCAT TGATTCAAAT CTATTCCGGA 
TTTATCTTCC GTGGGCCGGG TTTGATTAAG AATATCGTCA CTCATATCTA A

Protein sequence

MYYPLVRKAL FQLDPERAHE LTFRQLKRVS GTPLEFLVRQ SVPTKPVSCM GLSFKNPVGL 
AAGLDKDGEC IDALGAMGFG FIEVGTVTPR PQVGNDKPRL FRIVEAEGLI NRMGFNNHGV 
DNLIENVKKS HFGGILGINI GKNKDTPVEQ GKEDYLICMD KIYPYAGYIA INISSPNTPG 
LRSLQYGEAL DDLLAAIKDK QTELHQRHHK YVPVAVKIAP DLTEEELIQI ADSLVRHNID 
GVIATNTTLD RSLIQGLNYC EQAGGLSGRP LQLRSTEVIH RLSQELKGRL PIIGVGGIDS 
VTAAREKMAA GASLIQIYSG FIFRGPGLIK NIVTHI