Gene BAS3739 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS3739
Symbol	pyrC
ID	2852141
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	3707491
End bp	3708777
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	40%
IMG OID	637506977
Product	dihydroorotase
Protein accession	YP_029990
Protein GI	49186738
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.170477
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTATT TGTTTAAAAA TGGTCGTTAT ATGAATGAAG AAGGAAAAAT CGTAGCAACG 
GATCTTCTAG TACAAGACGG TAAAATCGCT AAAGTAGCAG AAAATATTAC GGCAGATAAT 
GCTGAAGTGA TCGATGTGAA CGGAAAGTTA ATCGCACCTG GATTAGTAGA TGTACACGTA 
CACCTTCGTG AACCAGGTGG TGAACATAAA GAAACAATTG AAACAGGTAC ATTAGCAGCG 
GCAAAAGGTG GATTCACTAC AATTTGCGCA ATGCCAAATA CACGCCCAGT ACCAGATTGC 
AGAGAACATA TGGAAGACTT GCAAAATCGT ATTAAAGAAA AAGCACATGT TAACGTACTA 
CCATATGGAG CAATTACAGT ACGTCAAGCC GGTTCTGAAA TGACAGATTT CGAAACATTA 
AAAGAGCTTG GAGCATTTGC TTTCACTGAT GACGGTGTAG GCGTACAAGA TGCTAGCATG 
ATGTTAGCTG CTATGAAGCG TGCAGCGAAA TTAAATATGG CAGTAGTTGC GCACTGTGAA 
GAGAATACTC TTATTAATAA AGGTTGTGTA CATGAAGGGA AGTTTTCTGA GAAACACGGA 
TTAAACGGTA TCCCATCAGT ATGTGAATCT GTACATATTG CAAGGGATAT ACTGCTTGCT 
GAAGCAGCAG ATTGTCACTA TCACGTATGT CACGTAAGTA CGAAAGGCTC TGTACGCGTA 
ATTCGTGATG CAAAGCGCGC TGGAATTAAA GTAACAGCAG AGGTAACGCC TCATCACTTA 
GTGTTATGTG AAGATGATAT CCCATCAGCT GATCCTAATT TTAAAATGAA CCCACCGCTT 
CGTGGAAAAG AAGACCACGA AGCATTAATT GAAGGTTTAT TAGATGGAAC AATCGATATG 
ATCGCAACTG ACCATGCACC GCATACAGCA GAAGAGAAAG CGCAAGGAAT TGAAAGAGCA 
CCATTCGGGA TTACTGGTTT TGAAACTGCA TTCCCACTTC TATACACAAA CCTTGTGAAA 
AAAGGAATTA TTACACTAGA GCAGTTAATT CAATTCTTAA CAGAAAAGCC AGCTGATACA 
TTCGGCTTAG AAGCAGGTCG CCTGAAAGAA GGTAGAACAG CTGATATTAC AATCATTGAT 
TTAGAACAAG AAGAAGAGAT TGACCCAACA ACATTCTTAT CAAAAGGAAA AAATACACCA 
TTCGCAGGTT GGAAATGCCA AGGATGGCCG GTAATGACAA TCGTTGGTGG TAAGATCGCA 
TGGCAAAAGG AGAGTGCATT AGTATGA

Protein sequence

MNYLFKNGRY MNEEGKIVAT DLLVQDGKIA KVAENITADN AEVIDVNGKL IAPGLVDVHV 
HLREPGGEHK ETIETGTLAA AKGGFTTICA MPNTRPVPDC REHMEDLQNR IKEKAHVNVL 
PYGAITVRQA GSEMTDFETL KELGAFAFTD DGVGVQDASM MLAAMKRAAK LNMAVVAHCE 
ENTLINKGCV HEGKFSEKHG LNGIPSVCES VHIARDILLA EAADCHYHVC HVSTKGSVRV 
IRDAKRAGIK VTAEVTPHHL VLCEDDIPSA DPNFKMNPPL RGKEDHEALI EGLLDGTIDM 
IATDHAPHTA EEKAQGIERA PFGITGFETA FPLLYTNLVK KGIITLEQLI QFLTEKPADT 
FGLEAGRLKE GRTADITIID LEQEEEIDPT TFLSKGKNTP FAGWKCQGWP VMTIVGGKIA 
WQKESALV