Gene YpAngola_A1984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A1984
Symbol	pyrD
ID	5800454
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	2069328
End bp	2070338
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	43%
IMG OID	641339907
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_001606457
Protein GI	162421364
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATTATC CACTTGTCAG AAAAGCACTA TTTCAGCTTG ATCCAGAACG TGCCCATGAA 
TTGACTTTTC GTCAGTTAAA GCGTGTTAGC GGCACACCTT TGGAATTTTT GGTACGCCAG 
TCGGTACCCA CCAAACCGGT CAGTTGTATG GGCCTGTCTT TTAAAAATCC AGTAGGTTTG 
GCTGCGGGCC TGGATAAAGA CGGTGAGTGT ATTGATGCCT TGGGCGCCAT GGGCTTTGGT 
TTCATTGAAG TGGGCACTGT GACACCACGG CCTCAGGTGG GGAATGATAA GCCGAGATTA 
TTCAGGATCG TCGAAGCTGA AGGTTTGATC AACCGCATGG GGTTTAATAA TCATGGGGTC 
GACAACCTTA TTGAAAATGT TAAAAAATCC CATTTTGGCG GTATATTGGG CATTAATATC 
GGCAAGAATA AAGATACGCC AGTCGAACAA GGTAAAGAAG ATTACCTGAT TTGCATGGAT 
AAAATTTATC CTTATGCTGG ATATATTGCG ATTAATATTT CCTCACCTAA TACACCGGGG 
TTACGATCCT TACAGTACGG TGAAGCATTA GATGATTTAT TAGCTGCAAT TAAAGATAAA 
CAAACTGAGC TACATCAACG CCATCATAAG TATGTTCCCG TAGCGGTGAA GATCGCGCCG 
GATCTTACTG AAGAGGAATT GATCCAAATA GCAGATAGCT TGGTCCGCCA TAATATTGAT 
GGCGTTATTG CTACTAATAC GACTTTAGAT CGTTCTCTGA TTCAGGGATT AAATTATTGC 
GAGCAAGCCG GTGGATTAAG TGGCCGCCCA TTACAATTAC GCAGTACTGA GGTTATTCAT 
CGTTTATCAC AAGAGCTAAA AGGGCGCCTG CCTATTATCG GTGTTGGTGG TATTGATTCC 
GTTACTGCAG CACGGGAAAA GATGGCGGCT GGTGCTTCAT TGATTCAAAT CTATTCCGGA 
TTTATCTTCC GTGGGCCGGG TTTGATTAAG AATATCGTCA CTCATATCTA A

Protein sequence

MYYPLVRKAL FQLDPERAHE LTFRQLKRVS GTPLEFLVRQ SVPTKPVSCM GLSFKNPVGL 
AAGLDKDGEC IDALGAMGFG FIEVGTVTPR PQVGNDKPRL FRIVEAEGLI NRMGFNNHGV 
DNLIENVKKS HFGGILGINI GKNKDTPVEQ GKEDYLICMD KIYPYAGYIA INISSPNTPG 
LRSLQYGEAL DDLLAAIKDK QTELHQRHHK YVPVAVKIAP DLTEEELIQI ADSLVRHNID 
GVIATNTTLD RSLIQGLNYC EQAGGLSGRP LQLRSTEVIH RLSQELKGRL PIIGVGGIDS 
VTAAREKMAA GASLIQIYSG FIFRGPGLIK NIVTHI