Gene CPR_1200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPR_1200
Symbol	pyrC
ID	4206448
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens SM101
Kingdom	Bacteria
Replicon accession	NC_008262
Strand	-
Start bp	1345144
End bp	1346343
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	31%
IMG OID	642565756
Product	dihydroorotase, multifunctional complex type
Protein accession	YP_698522
Protein GI	110801777
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0128604
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTTGC TAATTAAAAA TGTAAATTTA ATAGATGAAA GCAACAACTT TTTTGGTGAT 
ATATATATAG AAAAAGGGGT AATAAAAGAA CTTGGAACTG AACTAAATAA AGAATGCGAA 
ACTCTAGATG GAAAAGGCTT AGTACTTATG CCTGCATTTA TAGATACTCA TGCACACTTT 
AGAGATCCAG GCTTTGAATA TAAAGAGGAT ATTGAAAGTG GATCTAAGGC TGCAGTTAGG 
GGTGGATACA CAACAGTAAC CTTAATGCCA AACACAAAAC CCGTTTGTAG TTCAAAAGAA 
ATTTTAGATT ATGTGGTTAA TAAGGGTAAA GAGGTAGACT TAGTAGATCT ATATCAAACA 
GTTTCCATAA CAAAGAATTT ATCAGGTGAA GAAATAAATC ATCTTAGAGA ATTTGAGGGA 
AATCCTAATG TTAAGGCAAT AACAGATGAT GGTAAAGGTG TATCAGATTC TAAGATTATG 
ATGGAGGCTA TGAAAATAGC TAAGGAAAAT AACTGGATAG TAATGTCCCA TGCTGAAAGT 
CCAGAATTCT CAAAAGTTGA TATGAGATTA GCTGAAAATA TGATGACATG GAGAGATATT 
ACATTAGCAA AGTTTATAGA TTGTAGACTT CACATGTCTC ATGTAAGTAC TAAGGAAGCT 
ATGAAATATA TAATAGAAGG AAAAAATGAT GGAGTTAAAG TAACTTGCGA AATAACTCCT 
CACCATTTAG CTTTAAATAA TAAGATTAGT AATTATAGAG TTAATCCTCC TATAAGAGAA 
GAAGAGGATG TAAATTTCTT AATAAAGGCA ATAAAAATGA ACTATGTTGA TTGTATAGGA 
ACAGATCATG CTCCTCATTC AAAGGAAGAT AAGGAAAAAG GAGCACCTGG CATGATTGGA 
ATTGAACAAG CTTTCTCAAT ATGTTATACC AAGCTAGTTA AGGAAAATCA CATAAGCTTA 
AATAAGCTAA GTCAATTAAT GAGTGGAAAT GCTGCTAAAT TATTAAACTT AAATAAAGGA 
AAACTTCAAC CAGGTTTTCT TGGAGATTTA GTTCTTATAG ATTTAAACAA GAAAAGAATA 
TTCAAAGAAG AAGATATAGT ATCTAGAAGT AAAAACACAC CATTTAATGG AATGGAGTTT 
TATGGAGATG TAGTACTAAC AATAAAGAAT GGAAAAATAG TTTACAAGGG TGAATTTTAG

Protein sequence

MNLLIKNVNL IDESNNFFGD IYIEKGVIKE LGTELNKECE TLDGKGLVLM PAFIDTHAHF 
RDPGFEYKED IESGSKAAVR GGYTTVTLMP NTKPVCSSKE ILDYVVNKGK EVDLVDLYQT 
VSITKNLSGE EINHLREFEG NPNVKAITDD GKGVSDSKIM MEAMKIAKEN NWIVMSHAES 
PEFSKVDMRL AENMMTWRDI TLAKFIDCRL HMSHVSTKEA MKYIIEGKND GVKVTCEITP 
HHLALNNKIS NYRVNPPIRE EEDVNFLIKA IKMNYVDCIG TDHAPHSKED KEKGAPGMIG 
IEQAFSICYT KLVKENHISL NKLSQLMSGN AAKLLNLNKG KLQPGFLGDL VLIDLNKKRI 
FKEEDIVSRS KNTPFNGMEF YGDVVLTIKN GKIVYKGEF