Gene SNSL254_A1099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1099
Symbol	pyrD
ID	6482984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1107433
End bp	1108443
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	48%
IMG OID	642736502
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_002040261
Protein GI	194442283
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000085324
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACTATC CCTTCGTTCG TAAAGCCCTT TTCCAGCTCG ATCCAGAGCG CGCTCATGAA 
TTTACATTTC AACAATTACG CCGCATTACA GGTACGCCGC TGGAAGCGCT GGTGCGCCAG 
AAAGTACCGA CAAAGCCGGT TACCTGCATG GGACTTACCT TTAAAAATCC ACTGGGGTTG 
GCTGCCGGTC TGGATAAAGA CGGGGAGTGC ATCGACGCGT TAGGCGCGAT GGGGTTTGGC 
TCCCTGGAAA TCGGCACCGT GACGCCGCGC CCACAGCCGG GTAACGATAA GCCGCGTCTT 
TTTCGTCTGG TGGATGCTGA AGGTCTCATC AATCGGATGG GCTTTAATAA TCTGGGCGTC 
GATAACCTGG TCGAGAATGT TAAAAAAGCC CATTTTGATG GTATTCTGGG AATTAACATC 
GGTAAAAATA AAGATACGCC TGTCGAAAAT GGCAAAGATG ACTACCTGAT TTGTATGGAA 
AAAGTCTATG CTTATGCGGG TTATATCGCC ATTAATATTT CTTCGCCGAA TACGCCAGGG 
CTACGTACGC TCCAGTATGG CGATGCGCTG GACGATCTGT TAACTGCCAT TAAAAATAAG 
CAAAACGATC TTCAGGCGAT CCACCATAAA TATGTGCCGG TGGCAGTAAA GATCGCGCCG 
GATCTTTGTG AAGAGGAATT GATCCAGGTT GCCGATAGCC TGCTTCGTCA TAATATTGAT 
GGGGTGATTG CGACAAATAC CACCCTCGAT CGTTCTCTGG TACAAGGAAT GAAAAATTGC 
CAGCAAACGG GGGGATTAAG TGGCCGGCCA TTACAATTAA AAAGCACAGA AATTATTCGC 
CGTTTATCCC AGGAGTTAAA AGGACAATTG CCTATTATCG GCGTCGGCGG CATTGACTCA 
GTTATCGCCG CGCGCGAGAA GATAGCGGCA GGAGCTACGC TGGTACAAAT TTATTCCGGC 
TTTATTTTTA AAGGCCCGCC ATTGATTAAA GAAATCGTAA CGCACATCTA A

Protein sequence

MYYPFVRKAL FQLDPERAHE FTFQQLRRIT GTPLEALVRQ KVPTKPVTCM GLTFKNPLGL 
AAGLDKDGEC IDALGAMGFG SLEIGTVTPR PQPGNDKPRL FRLVDAEGLI NRMGFNNLGV 
DNLVENVKKA HFDGILGINI GKNKDTPVEN GKDDYLICME KVYAYAGYIA INISSPNTPG 
LRTLQYGDAL DDLLTAIKNK QNDLQAIHHK YVPVAVKIAP DLCEEELIQV ADSLLRHNID 
GVIATNTTLD RSLVQGMKNC QQTGGLSGRP LQLKSTEIIR RLSQELKGQL PIIGVGGIDS 
VIAAREKIAA GATLVQIYSG FIFKGPPLIK EIVTHI