Gene Strop_1854 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Strop_1854
Symbol	pyrC
ID	5058313
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora tropica CNB-440
Kingdom	Bacteria
Replicon accession	NC_009380
Strand	+
Start bp	2119179
End bp	2120456
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	73%
IMG OID	640474124
Product	dihydroorotase
Protein accession	YP_001158694
Protein GI	145594397
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.513427
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGCGT ATCTGATCAC CAACGTGAGC GTCCTCGGTG CCGCGCCGAC CGACCTGCTC 
ATCCGCGACG GTGTCGTGGC CGAGACCGGC GTGGGCCTGA CGGCCTCCGA CGCGGTCGTG 
GTCGACGGCA CCGGCCTGGT CGCCCTGCCC GGCCTGGTGG ACCTGCACAC CCATCTGCGT 
GAGCCCGGCC GGGAAGACGC CGAGACCGTG GCGACCGGCT CCCGCGCCGC GGCGCTCGGC 
GGTTTCACCG CCGTCTGCGC GATGGCGAAC ACCTCCCCGG TGGCCGACAC CGCCGGTGTG 
GTCGAGCAGG TCTGGCGGCT GGGCCGGGAG GCCGGGCTGG TCGACGTGCA GCCGATCGGC 
GCGGTCACGG TCGGGCTGGC CGGCCAGCGC CTGGCCGAGT TGGGCGCGAT GGCCGACTCC 
GCCGCCCGGG TGCGGATCTT CTCCGACGAC GGACACTGCG TCGCCGACCC GCGGTTGATG 
CGCCGGGCCC TGGAGTACGT GAAGGCGTTC GACGGGATCG TTGCCCAGCA CGCCGAGGAG 
CCACGGCTGA CCGAAGGCGC TCAGATGCAC GAGGGTGAGA TCTCCACCCG CCTTGGCCTG 
ACTGGCTGGC CGGCGGTCGC CGAGGAGGCG ATCATCGCCC GGGACGTGCT GCTCGCCGAG 
CACGTGGGTA GCCGCCTGCA CATCTGCCAC GTCTCCACGG CCGGCAGCGT CGGGGTGCTG 
CGGCAGGCCA AGGCCCGCGG CGTTCAGGTC ACTGCCGAGG TCACTCCGCA CCACCTGTTG 
TTGACCGACG AGAAGGCGGT TACCTACGAC CCGGTCTACA AGGTCAACCC GCCGCTGCGG 
ACCGCCGCCG ATGTCGCCGC ACTGCGCACC GCGCTGGCCG AGGGGGTCGT GGACATCGTC 
GCCACCGACC ACGCCCCGCA CTCCGTGGAG GACAAGGAGT GCGAGTGGGC GTATGCCCGG 
CCGGGCATGC TCGGCCTGGA GACGGCGCTC TCCATCACGC TGGACGTGCT CGGCCCGCGG 
TGGGACCTCA TCGCCGAGCG GATGTCCCGC ACCCCCGCCC GGATCGCTGG CCTCACCGAG 
CACGGCCACG ACCCCGCGCC GGGCGCGCCG GCGAACCTGA CCCTGGTGGA TCCGGCGGCG 
CGGCGCGTCG TCGAGCCGAC CGAGTTGGCC AGCCGCAGCC GCAACACCCC GTACGCCCGC 
ATGACGCTGC CGGGTCGCAT CGTGGCGACC TTCCTGCGCG GCGAGGCGAC GGTCCTGGAC 
GGAAAGGCAG TGAAGTGA

Protein sequence

MTAYLITNVS VLGAAPTDLL IRDGVVAETG VGLTASDAVV VDGTGLVALP GLVDLHTHLR 
EPGREDAETV ATGSRAAALG GFTAVCAMAN TSPVADTAGV VEQVWRLGRE AGLVDVQPIG 
AVTVGLAGQR LAELGAMADS AARVRIFSDD GHCVADPRLM RRALEYVKAF DGIVAQHAEE 
PRLTEGAQMH EGEISTRLGL TGWPAVAEEA IIARDVLLAE HVGSRLHICH VSTAGSVGVL 
RQAKARGVQV TAEVTPHHLL LTDEKAVTYD PVYKVNPPLR TAADVAALRT ALAEGVVDIV 
ATDHAPHSVE DKECEWAYAR PGMLGLETAL SITLDVLGPR WDLIAERMSR TPARIAGLTE 
HGHDPAPGAP ANLTLVDPAA RRVVEPTELA SRSRNTPYAR MTLPGRIVAT FLRGEATVLD 
GKAVK