Gene SeSA_A1120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A1120
Symbol	pyrD
ID	6517062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	1105849
End bp	1106859
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	48%
IMG OID	642746248
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_002114058
Protein GI	194737217
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00333644
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACTATC CCTTCGTTCG TAAAGCCCTT TTCCAGCTCG ATCCAGAGCG CGCTCATGAA 
TTTACATTTC AACAATTACG CCGCATTACA GGTACGCCGC TGGAAGCGCT GGTGCGCCAG 
AAAGTACCGA CAAAGCCGGT TACCTGCATG GGACTTACCT TTAAAAATCC ACTGGGGCTG 
GCTGCCGGTC TGGATAAAGA CGGGGAGTGC ATCGACGCGT TAGGCGCGAT GGGGTTTGGC 
TCCCTGGAAA TCGGCACCGT GACGCCGCGC CCACAGCCGG GTAACGATAA GCCGCGTCTT 
TTTCGTCTGG TGGATGCTGA AGGTCTGATC AATCGGATGG GCTTTAATAA TCTGGGCGTC 
GATAACCTGG TCGAGAATGT TAAAAAAGCC CATTTTGATG GTATTCTGGG AATTAACATC 
GGTAAAAATA AAGATACGCC TGTCGAAAAT GGCAAAGATG ACTACCTGAT TTGTATGGAA 
AAAGTCTATG CTTATGCGGG TTATATCGCC ATTAATATTT CTTCGCCGAA TACGCCAGGG 
CTACGTACGC TCCAGTATGG CGATGCGCTG GACGATCTGT TAACTGCCAT TAAAAATAAG 
CAAAACGATC TTCAGGCGAT CCACCATAAA TATGTGCCGG TGGCAGTAAA GATCGCGCCG 
GATCTTTGTG AAGAAGAATT GATCCAGGTT GCCGATAGCC TGCTTCGTCA TAATATTGAT 
GGGGTGATTG CGACAAATAC CACCCTCGAT CGTTCTCTGG TACAAGGAAT GAAAAATTGC 
CAGCAAACGG GGGGATTAAG TGGCCGGCCA TTACAATTAA AAAGCACAGA AATTATTCGC 
CGTTTATCCC AGGAGTTAAA AGGACAATTG CCTATTATCG GCGTCGGCGG CATTGACTCA 
GTTATCGCCG CGCGCGAGAA GATAGCGGCA GGAGCTACGC TGGTACAAAT TTATTCCGGC 
TTTATTTTTA AAGGCCCGCC ATTGATTAAA GAAATCGTAA CGCACATCTA A

Protein sequence

MYYPFVRKAL FQLDPERAHE FTFQQLRRIT GTPLEALVRQ KVPTKPVTCM GLTFKNPLGL 
AAGLDKDGEC IDALGAMGFG SLEIGTVTPR PQPGNDKPRL FRLVDAEGLI NRMGFNNLGV 
DNLVENVKKA HFDGILGINI GKNKDTPVEN GKDDYLICME KVYAYAGYIA INISSPNTPG 
LRTLQYGDAL DDLLTAIKNK QNDLQAIHHK YVPVAVKIAP DLCEEELIQV ADSLLRHNID 
GVIATNTTLD RSLVQGMKNC QQTGGLSGRP LQLKSTEIIR RLSQELKGQL PIIGVGGIDS 
VIAAREKIAA GATLVQIYSG FIFKGPPLIK EIVTHI