Gene RSP_1003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_1003
Symbol	pyrC
ID	3720719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007493
Strand	+
Start bp	2761226
End bp	2762503
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	72%
IMG OID	640072231
Product	dihydroorotase
Protein accession	YP_354087
Protein GI	77464583
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.15328
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTGC TTCTCACCAA CGCCCGGCTG ATCGACCCCG AGGGCGGCAC CGAGACCGAG 
GGCGACCTGC TGATCGAGGG CGGCCTCATC GCCGCCGTGG GCGCGCTCGA GCCGCCGCCC 
GGCGCCGAGG TCATCGACTG CGGCGGCAAG TGCCTCGCCC CCGGCATCGT CGATCTCGGC 
GTGAAGGTGG GCGAGCCCGG CGAGCGCCAC CGCGAGAGCT TCCGCTCGGC GGGCCTCGCC 
GCCGCCGCGG GCGGCGTCAC CACGATCATC GCCCGCCCCG ACACGATGCC CGCCATCGAC 
ACGCCCGAGG TGCTGGAATT CGTCACCCGC CGCGCCGCCG AGGCGAGCCC GGTCCGCATC 
CGCCACATGG CGGCGCTGAC CAGAGGCCGC GAGGGGCGCG AGATGGTGGA GCTCGGCTTC 
CTGCTCGACA CCGGCGCCGT GGCCTTCTCC GACTGCGACC ATGTGATCGA GACCACCAAG 
GTCGCCGCCC GCTGCATGAC CTATGCCCGC AGCCTCGGCG CCCTCGTGAT CGGCCATCCG 
CAGGATCCGG GCCTCTCGGC CGGCGCCTCC GCCACCAATG GCAAGTTCGC GAGCCTGCGC 
GGCATCCCGG CCGTCCATCC GATGGCCGAG CGCATGGGCT TCGACCGCGA CATGGCGCTG 
GTCGAGATGT CGGGGGTGCG CTACCACGCC GATCAGGTCA CCACCGCCCG CACCCTGCCC 
GCGCTGGAAC GGGCCAAGGC CAACGGGCTC GACGTGACGG CGGGCGTGGG CATCCACCAC 
CTGACGCTGA ACGAGTTCGA CGTCGGCGAT TACCGCACCT TCTTCAAGCT GAAGCCGCCG 
CTGCGCTCGG AAGAGGACCG GCTGGCGATG GTCGAGGCGG TGGGGTCGGG GCTGATCGAC 
ATCATCTCCT CGATGCACAC GCCGCAGGAC GAGGAATCGA AGCGCCTGCC CTTCGAGGAA 
GCTGCCTGGG GCGCCGTCGC GCTCGAGACC TTCCTGCCCG CGGCCCTCCG GCTCTATCAT 
GCGGGCCGCC TGACCCTGCC GCAGCTGTTC CGGGCCATGG CGATCAACCC GGCGAAGCGG 
CTCGGCCTGC CGCAGGGGCG GCTCTCCGAT GGGGCGCCGG CCGATCTCGT GCTCTTCGAT 
CCCGACGCGC CCTTCGTGCT CGACCGCTTC ACCCTGCGCT CGAAATCGAA GAACACGCCC 
TTCGACGGCC AGCGGATGGA GGGGCGGGTG CTCGCCACCT ATGTCGGCGG CCGACGGGTC 
TACGCCGCGG GTGAATGA

Protein sequence

MSLLLTNARL IDPEGGTETE GDLLIEGGLI AAVGALEPPP GAEVIDCGGK CLAPGIVDLG 
VKVGEPGERH RESFRSAGLA AAAGGVTTII ARPDTMPAID TPEVLEFVTR RAAEASPVRI 
RHMAALTRGR EGREMVELGF LLDTGAVAFS DCDHVIETTK VAARCMTYAR SLGALVIGHP 
QDPGLSAGAS ATNGKFASLR GIPAVHPMAE RMGFDRDMAL VEMSGVRYHA DQVTTARTLP 
ALERAKANGL DVTAGVGIHH LTLNEFDVGD YRTFFKLKPP LRSEEDRLAM VEAVGSGLID 
IISSMHTPQD EESKRLPFEE AAWGAVALET FLPAALRLYH AGRLTLPQLF RAMAINPAKR 
LGLPQGRLSD GAPADLVLFD PDAPFVLDRF TLRSKSKNTP FDGQRMEGRV LATYVGGRRV 
YAAGE