Gene Amir_5244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_5244
Symbol	pyrC
ID	8329446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	6241225
End bp	6242526
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	75%
IMG OID	644945683
Product	dihydroorotase
Protein accession	YP_003102911
Protein GI	256379251
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.937093
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAACCCGC TGCTGCTCAG GGGCGTGCGC CCCTACGGCG AGGGCGAGCC GGTCGACGTG 
CTCGTCCGCG ACGGCGTGAT CGCCGAGCTG GCCGCGACGA TCGACGCCGC GACGATCGAC 
GCCGACGACG TCCAGGTCGT CGACGGCAAT GGCGCGGTCC TGCTGCCCGG CTTCGTCGAC 
CTGCACACCC ACCTGCGCGA GCCCGGCCGC GAGGACACCG AGACCATCGC GACCGGGTCC 
GCCGCCGCCG CGCTCGGCGG CTACACCGCC GTGTTCGCCA TGGCCAACAC CGACCCGGTG 
GCCGACAACG CCGTCGTCGT GGAGCACGTG GCCCGGCGTG GCCGCGAGGT CGGCCTGGCC 
GACGTGCACC CGGTCGGCGC GGTCACCGTC GGCCTCAAGG GCGAGAAGCT CGCCGAGCTC 
GGCACGATGG CCAAGGTCGG CGTGCGCGTC TTCTCCGACG ACGGCCACTG CGTGCACGAC 
CCGCTGCTGA TGCGCCGCGC GCTGGAGTAC AGCCGCGCGC TCGACGCGGT CATCGCCCAG 
CACGCCGAGG AGCCCCGGCT CACCGTCGGC GCGCAGGCCC ACGAGGGCGA GAACGCCGCC 
CGGCTCGGGC TCCAGGGCTG GCCGGCCTCG GCCGAGGAGT CGATCGTGGC GCGCGACTGC 
CTGCTCGCGC TGCACGCCGA GGCCCGCCTG CACGTGTGCC ACGTGTCCAC CTCGGGCACC 
GCCGACGTGC TGCGCTGGGC CAAGGCGCGG GGCACGCGGG TGTCCGCCGA GGTCACCCCG 
CACCACCTGC TGCTCGACGA CAGCAGGCTC GCCACCTACG ACCCGGTCAA CAAGGTCAAC 
CCGCCGCTGC GCGCCGAGTC CGACGTCCTC GCGCTGCGCG CCGCGCTCGC GGACGGCTCG 
ATCGACTGCG TCGCCACCGA CCACGCCCCG CACGCCGTGC AGGACAAGGA CTGCGAGTGG 
TCCGCCGCGC GGCCGGGGAT GCTCGGCCTG CAGACCGCGC TGTCCGTGGT CGCCGAGACC 
ATGGTCGCCA CCGGCCTGCT CGACTGGCGC GGCGTCGCCC GCGTCATGTC CGAGCGCCCG 
GCGGAGATCG GCGGCCTCGC CGACCAGGGC CGCCCGATCG CGGTCGGCGA GCCCGCGAAC 
CTGGCGCTGG TCGACCCGGA CGCCCGCTGG ACCGTGCGCG GGGCCGACTT CGCCAGCATC 
GCGGCGAACA CCCCGTTCGA GGGGATGGAG CTCCCCGCCG CCGTCGTGGC GACGGTCCTG 
CGCGGGCGAG TCACCGCGCT CAGCGGAAGG ATCCAGCCAT GA

Protein sequence

MNPLLLRGVR PYGEGEPVDV LVRDGVIAEL AATIDAATID ADDVQVVDGN GAVLLPGFVD 
LHTHLREPGR EDTETIATGS AAAALGGYTA VFAMANTDPV ADNAVVVEHV ARRGREVGLA 
DVHPVGAVTV GLKGEKLAEL GTMAKVGVRV FSDDGHCVHD PLLMRRALEY SRALDAVIAQ 
HAEEPRLTVG AQAHEGENAA RLGLQGWPAS AEESIVARDC LLALHAEARL HVCHVSTSGT 
ADVLRWAKAR GTRVSAEVTP HHLLLDDSRL ATYDPVNKVN PPLRAESDVL ALRAALADGS 
IDCVATDHAP HAVQDKDCEW SAARPGMLGL QTALSVVAET MVATGLLDWR GVARVMSERP 
AEIGGLADQG RPIAVGEPAN LALVDPDARW TVRGADFASI AANTPFEGME LPAAVVATVL 
RGRVTALSGR IQP