Gene YpAngola_A0402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A0402
Symbol	pyrC
ID	5798866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	414568
End bp	415614
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	50%
IMG OID	641338409
Product	dihydroorotase
Protein accession	YP_001605008
Protein GI	162421294
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0418] Dihydroorotase
TIGRFAM ID	[TIGR00856] dihydroorotase, homodimeric type

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.0202499
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCAC AACCCCAAAC CCTAAAAATT CGCCGCCCGG ATGACTGGCA CATTCATCTA 
CGTGATGATG AAATGCTCAG TACCGTGTTG CCCTATACCT CCGAAGTATT CGCCCGCGCT 
ATTGTTATGC CAAATCTAGC CCAGCCAATT ACAACGGTTG CCAGTGCTAT TGCTTATCGG 
GAGCGTATTT TAGCAGCGGT TCCTGCGGGC CATAAATTCA CCCCGTTGAT GACGTGTTAC 
CTGACTAATA GCCTTGATGC TAAAGAGTTG ACCACGGGTT TTGAGCAAGG CGTTTTTACC 
GCGGCCAAAC TGTATCCGGC CAATGCCACC ACCAACTCCA CTCACGGTGT ATCTGACATC 
CCGGCAATTT ACCCGTTGTT TGAACAAATG CAAAAGATAG GCATGCCCCT GCTTATTCAC 
GGTGAGGTAA CAGATGCGGC CGTTGACATC TTTGATCGTG AAGCCCGTTT TATTGACCAA 
ATTTTAGAGC CCATTCGCCA AAAGTTTCCC GAACTAAAAA TTGTCTTTGA GCATATCACG 
ACCAAAGATG CGGCAGATTA TGTGCTGGCA GGCAATCGTT TCCTTGGGGC AACCGTCACG 
CCACAACACT TGATGTTTAA CCGCAATCAC ATGCTGGTAG GCGGTATTCG CCCCCACTTG 
TTCTGCCTGC CAATATTGAA GCGCAGCACC CATCAGCAAG CATTGCGCGC AGCCGTCGCC 
AGTGGTTCTG ATCGCTTCTT CCTTGGGACC GATTCAGCTC CCCATGCCAA ACATCGTAAA 
GAGTCATCTT GCGGCTGTGC GGGTGTATTC AACGCCCCAG CGGCATTGCC TGCTTATGCT 
TCCGTGTTTG AGGAACTGAA TGCATTGCAA CATCTGGAAG CGTTTTGCGC CTTAAATGGC 
CCACGATTTT ATGGCTTGCC TGTTAATGAT GACGTTGTTG AATTGGTTCG CACTCCATTC 
CTGCAGCCAG AAGAGATCCC ATTAGGCAAT GAATCGGTTA TTCCTTTCCT TGCGGGTCAA 
ACGCTTAATT GGTCAGTGAA ACGCTAA

Protein sequence

MTAQPQTLKI RRPDDWHIHL RDDEMLSTVL PYTSEVFARA IVMPNLAQPI TTVASAIAYR 
ERILAAVPAG HKFTPLMTCY LTNSLDAKEL TTGFEQGVFT AAKLYPANAT TNSTHGVSDI 
PAIYPLFEQM QKIGMPLLIH GEVTDAAVDI FDREARFIDQ ILEPIRQKFP ELKIVFEHIT 
TKDAADYVLA GNRFLGATVT PQHLMFNRNH MLVGGIRPHL FCLPILKRST HQQALRAAVA 
SGSDRFFLGT DSAPHAKHRK ESSCGCAGVF NAPAALPAYA SVFEELNALQ HLEAFCALNG 
PRFYGLPVND DVVELVRTPF LQPEEIPLGN ESVIPFLAGQ TLNWSVKR