Gene SeHA_C1167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C1167
Symbol	pyrD
ID	6490511
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	1151686
End bp	1152696
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	48%
IMG OID	642741408
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_002045060
Protein GI	194450766
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0101504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	84
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACTATC CCTTCGTTCG TAAAGCCCTT TTCCAGCTCG ATCCAGAGCG CGCTCATGAA 
TTTACATTTC AACAATTACG CCGCATTACA GGTACGCCGC TGGAAGCGCT GGTGCGCCAG 
AAAGTACCGA CAAAGCCGGT TACCTGCATG GGACTTACCT TTAAAAATCC ACTGGGGCTG 
GCTGCCGGTC TGGATAAAGA CGGGGAGTGC ATCGACGCGT TAGGCGCGAT GGGGTTTGGC 
TCCCTGGAAA TCGGCACCGT GACGCCGCGC CCACAGCCGG GTAACGATAA GCCGCGTCTT 
TTTCGTCTGG TGGATGCTGA AGGTCTGATC AATCGGATGG GCTTTAATAA TCTGGGCGTC 
GATAACCTGG TCGAGAATGT TAAAAAAGCC CATTTTGATG GTATTCTGGG AATTAACATC 
GGTAAAAATA AAGATACGCC TGTCGAAAAT GGCAAAGATG ACTACCTGAT TTGTATGGAA 
AAAGTCTATG CTTATGCGGG TTATATCGCC ATTAATATTT CTTCGCCGAA TACGCCAGGG 
CTACGTACGC TCCAGTATGG CGATGCGCTG GACGATCTGT TAACTGCCAT TAAAAATAAG 
CAAAACGATC TTCAGGCGAT CCACCATAAA TATGTGCCGG TGGCAGTAAA GATCGCGCCG 
GATCTTTGTG AAGAAGAATT GATCCAGGTT GCCGATAGCC TGCTTCGTCA TAATATTGAT 
GGGGTGATTG CGACAAATAC CACCCTCGAT CGTTCTCTGG TACAAGGAAT GAAAAATTGC 
CAGCAAACGG GGGGATTAAG TGGCCGGCCA TTACAATTAA AAAGCACAGA AATTATTCGC 
CGTTTATCCC AGGAGTTAAA GGGACAATTG CCTATTATCG GCGTCGGCGG CATTGACTCA 
GTTATCGCCG CGCGCGAGAA GATAGCGGCA GGAGCTACGC TGGTACAAAT TTATTCCGGC 
TTTATTTTTA AAGGCCCGCC ATTGATTAAA GAAATCGTAA CGCACATCTA A

Protein sequence

MYYPFVRKAL FQLDPERAHE FTFQQLRRIT GTPLEALVRQ KVPTKPVTCM GLTFKNPLGL 
AAGLDKDGEC IDALGAMGFG SLEIGTVTPR PQPGNDKPRL FRLVDAEGLI NRMGFNNLGV 
DNLVENVKKA HFDGILGINI GKNKDTPVEN GKDDYLICME KVYAYAGYIA INISSPNTPG 
LRTLQYGDAL DDLLTAIKNK QNDLQAIHHK YVPVAVKIAP DLCEEELIQV ADSLLRHNID 
GVIATNTTLD RSLVQGMKNC QQTGGLSGRP LQLKSTEIIR RLSQELKGQL PIIGVGGIDS 
VIAAREKIAA GATLVQIYSG FIFKGPPLIK EIVTHI