Gene Msed_1961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msed_1961
Symbol	pyrC
ID	5103348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Metallosphaera sedula DSM 5348
Kingdom	Archaea
Replicon accession	NC_009440
Strand	-
Start bp	1900141
End bp	1901292
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	51%
IMG OID	640507849
Product	dihydroorotase
Protein accession	YP_001192025
Protein GI	146304709
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.608866
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGTGGATTA AGGGAAAGCT TTTCCTAGGA GAGATAGTGG AGGGTTGCGT GGGATTTGAT 
AGGAGGATAA GGGAGACCAG AAGGGAATGT AAGCCTGACC TGAAGCTACC TGAGGACTCC 
CTCATATTTC CTGCTGGAGT TGACATGCAC GTTCACCTTA GGGGACTTCA GCTTTCTTAC 
AAGGAAACCG TGGCCTCTGC CACCTCTGAG GCAGTGTACG GTGGCATAGG GGTTGTGGTA 
GATATGCCCA ACACCTCTCC GGTGATCAAC AGCGAGGAAA CTATCAAGCT AAGGCTCGCT 
GAACTGGCGA ATCATTCGAG GTGCGATTAC GGTATTTACT CGGGGGTAAC CAAGGAGAAC 
GTGGATAACA TGCCCATAGC AGGGTACAAG GTATTCCCTG AGGATCTCGA GAGGGAAGAG 
GTGGAAAGGG TATTCTCTTC ACCCAAGCTC AAGATTCTTC ATCCCGAAAT CCCAATGTCA 
CTACGTCCAG GTAGGGGTAA CAGGCGTCTT TGGCAAGAGA TAGCCTCCCT CTTCCTCATC 
AGGGGAAAGT TTCACATAAC ACATGTGAGT AACCTTGAGA CCCTGAGGAT TGCAAGGAGC 
TTGGGCTACA CAACAGACCT AACCATGCAT CACCTTCTCG TTGACGGGGA GAGGAATTGC 
CTTTCGAAGG TTAACCCACC CATCAGGGAT ATCACAGAGA GAAGGAAATT GCTCTCAGCC 
CTATTCGAAG CAGATGCAGT CGCAAGCGAT CATGCTCCAC ACTCGAGCTG GGAAAAGGGT 
TTACCATTTG AGGTATGTCC GCCTGGTATC CCGGCAATGT CCTTCACTCT CCCCTTCATT 
TACACCCTCG CGTTTAGGGG AGTGCTTCCC ATCTCAAGGG CCGTGGAGTT AACGGCAACT 
GGGCCAAGCA AAATCTTGGG GATCAAGGCC GGTGAGATAA GGGAGGGTTA CCTGGCCAAC 
TTCGTCATCC TTAGAAAGGA TAGGTGGAGA TACTCCACCA GGTATAGTAA GGCCATACAC 
ACTCCGCTGG ACGGTTTCGC CCTAGACGCA ACCGTGTATG GAACAATTGT AGAAGGAAAG 
GTAGCTTATC TAGAGGGACA TTCCTATCCT GTGAGGGGAT CCAATGTATT CGACGAGACT 
GGCAGGAGTT GA

Protein sequence

MWIKGKLFLG EIVEGCVGFD RRIRETRREC KPDLKLPEDS LIFPAGVDMH VHLRGLQLSY 
KETVASATSE AVYGGIGVVV DMPNTSPVIN SEETIKLRLA ELANHSRCDY GIYSGVTKEN 
VDNMPIAGYK VFPEDLEREE VERVFSSPKL KILHPEIPMS LRPGRGNRRL WQEIASLFLI 
RGKFHITHVS NLETLRIARS LGYTTDLTMH HLLVDGERNC LSKVNPPIRD ITERRKLLSA 
LFEADAVASD HAPHSSWEKG LPFEVCPPGI PAMSFTLPFI YTLAFRGVLP ISRAVELTAT 
GPSKILGIKA GEIREGYLAN FVILRKDRWR YSTRYSKAIH TPLDGFALDA TVYGTIVEGK 
VAYLEGHSYP VRGSNVFDET GRS