Gene Sare_1847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1847
Symbol	pyrC
ID	5704710
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2130028
End bp	2131305
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	73%
IMG OID	641271348
Product	dihydroorotase
Protein accession	YP_001536723
Protein GI	159037470
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.140759
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGCGT ATCTGATCAC CAATGTGAGT GTCCTCGGTG CCGCGCCGAC CGACCTGCTG 
ATCCGCGACG GCGTCGTGGC CGAGGCCGGC ACGGGCCTGG CCGCCCCGGA TGCCGTCGTG 
GTCAACGGTA CCGGGCTGGT CGCCCTGCCC GGCCTGGTCG ACCTGCACAC TCACCTGCGC 
GAGCCCGGCC GGGAGGACGC CGAAACCGTC GAGACCGGCT CCCGGGCGGC GGCGCTCGGC 
GGCTACACGG CGGTCTGCGC GATGGCGAAC ACCTCCCCGG TCGCCGACAC CGCCGGTGTG 
GTCGAGCAGG TCTGGCGGCT GGGCCGGGAG GCCGGGCTGG TGGACGTGCA GCCGATCGGC 
GCGGTCACGG TCGGCCTGGC CGGTGAGCGG CTGGCCGAGT TGGGTGCGAT GGCCGACTCC 
GCCGCCCGGG TACGGGTCTT CTCCGACGAC GGGCACTGCG TCGCCGATCC CCGGTTGATG 
CGTCGGGCCC TGGAGTACGT GAAGGCGTTC GACGGAATCG TCGCCCAGCA CGCCGAGGAG 
CCACGGCTGA CCGAGGGTGC CCAGATGCAC GAGGGTGAGG TCGCCACCCG CCTCGGCCTG 
ACCGGTTGGC CGGCGGTCGC CGAGGAGGCG ATCATCGCCC GGGACGTGTT GCTCGCCGAG 
CATGTGGGCA GCCGCCTGCA CGTCTGCCAC GTCTCCACGG CGGGCAGCGT CGGGGTGCTG 
CGGCAGGCCA AGGCCCGAGG CGTCCAGGTC ACCGCGGAGG TCACCCCGCA CCACCTGCTG 
CTGACCGATG AGAAGGCGGC CACGTACGAC CCGGTCTACA AGGTCAACCC ACCGCTGCGG 
ACCGCCGCCG ACATCGCCGC GCTGCGCACC GCACTGGCCG AGGGCATCAT CGACATCGTC 
GCCACCGACC ACGCCCCGCA CGCGGTGGAG GACAAGGAGT GCGAGTGGGC GTACGCCCGG 
CCGGGCATGC TCGGCCTGGA GACGGCGCTG TCCATCGCGC TGGACGTGCT CGGCCCGCAG 
TGGGACCTCA TCGCCGAGCG GATGTCCCGT GCCCCCGCCC GGATCGCGGG CCTGGCCGAG 
CACGGCCACG ACCCGGCACC GGGCGCACCG GCGAACCTGA CGCTGGTGGA TCCGGCGGCC 
CGCCGTACGG TCGAGCCGAC CGAGTTGGCC AGCCGTAGCC GCAACACCCC GTACGCCCGC 
ATGACGCTGC CGGGTCGCAT CGTGGCGACC TTCCTGCGCG GTGTGGCGAC GGTTCTGGAC 
GGAAAGGCAG TGAAGTGA

Protein sequence

MTAYLITNVS VLGAAPTDLL IRDGVVAEAG TGLAAPDAVV VNGTGLVALP GLVDLHTHLR 
EPGREDAETV ETGSRAAALG GYTAVCAMAN TSPVADTAGV VEQVWRLGRE AGLVDVQPIG 
AVTVGLAGER LAELGAMADS AARVRVFSDD GHCVADPRLM RRALEYVKAF DGIVAQHAEE 
PRLTEGAQMH EGEVATRLGL TGWPAVAEEA IIARDVLLAE HVGSRLHVCH VSTAGSVGVL 
RQAKARGVQV TAEVTPHHLL LTDEKAATYD PVYKVNPPLR TAADIAALRT ALAEGIIDIV 
ATDHAPHAVE DKECEWAYAR PGMLGLETAL SIALDVLGPQ WDLIAERMSR APARIAGLAE 
HGHDPAPGAP ANLTLVDPAA RRTVEPTELA SRSRNTPYAR MTLPGRIVAT FLRGVATVLD 
GKAVK