Gene RPC_2246 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_2246
Symbol
ID	3973263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	2450238
End bp	2451551
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	68%
IMG OID	637925354
Product	dihydroorotase
Protein accession	YP_532119
Protein GI	90423749
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.607356
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.303532
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAGTA ACATGCTGAC AGACCGCCGC CCGATCCTGC TCGCCAACGC CCGCCTGATC 
GATCCCTCGC GCGACGTCGA CGGCATCGGC GACGTGCTGA TCGCCGACGG CACCATTCGC 
GAAGCGCGCC GCGGCATCGG CGCCGCCGGC GTGCCGGAAG GCACCGACAT CATCAACTGC 
GCCGGCAAGA TCGTGGCGCC CGGCCTGATC GACATGCGCG CCTTCGTCGG CGAGCCCGGC 
GCCGGTCACC GCGAGACCTT CGCCTCGGCG AGCCAGGCCG CCGCCGCCGG CGGCATCACC 
ACCATTATCT GCCAGCCCGA CACCTCGCCC ACTATCGACA ATTCGGCGAC CGTCGACTTC 
GTGTTGCGCC GCGCCCGCGA TACCGCGATC GTCAATATCC ATCCGATGGC GGCGCTGACC 
AAGGATCTTG CCGGCCACGA GATGACCGAG ATCGGGCTAC TGAAAGCCGC CGGCGCGGTC 
GCCTTCACCG ATGGCGTCAG AAGCGTTATG GACGCCCAAG TGATGCGCCG CGCGCTGACC 
TATGCGCGCG ACTTCGACGC CTTGATCGTG CATCACACCG AAGATCCCAA TCTGGTCGGC 
GAAGGCGTGA TGAACGAGGG CGAACTCGCT TCACGGCTCG GGTTGATCGG GGTGCCGAAC 
ATCGCCGAAG CTGTGGTGCT GGAGCGCGAC ATGCGGCTCG TCGCGCTGAC CGGCGGCCGT 
TACCACGCCG CCTCGATCAC CTGTGTGGAG TCGATCGAGA TCCTGCGCCG GGCCCGCGAG 
GCCGGGCTCA AGGTCACCGC CTCCGCCTCG ATCAACCATC TGACGCTGAA CGAGAACGAC 
ATCGGCCCCT ACCGCTCGTT CCTGAAGCTG TCGCCGCCGC TGCGCACCGA GGACGACCGC 
CAGGCGCTGG TCGCCGCGGT CGCCGCGGGT CTTATCGACG TCATCATGTC CGACCACAAT 
CCACAGGACG TCGAGGTGAA GCGGCTGCCG TTCGCCGAGG CCGCCGCCGG CGCCATCGGC 
CTTGAGACCA TGCTGCCGGC CGGCCTGCGG CTGATCCACT CCGGCGAGTT GGATTTCCTG 
ACGCTGATCC GGGCGATGTC GACCAAGCCT GCCGAATTGC TCGGCCTGCC CGGCGGCACG 
CTGCGTGCCG GCTCCCCCGC CGACCTGATT GTGATCGACG CCGACGTGCC CTGGGTGGTC 
GACCCCAACG AACTAAAGTC GAAGTGCAAG AACACGCCGT TCGACGAGGC CAAATTCGCC 
GGACGCGTCG CCCGCACCAT CGTCGCAGGC CGCACCGTGT ACGAACACGT CTGA

Protein sequence

MRSNMLTDRR PILLANARLI DPSRDVDGIG DVLIADGTIR EARRGIGAAG VPEGTDIINC 
AGKIVAPGLI DMRAFVGEPG AGHRETFASA SQAAAAGGIT TIICQPDTSP TIDNSATVDF 
VLRRARDTAI VNIHPMAALT KDLAGHEMTE IGLLKAAGAV AFTDGVRSVM DAQVMRRALT 
YARDFDALIV HHTEDPNLVG EGVMNEGELA SRLGLIGVPN IAEAVVLERD MRLVALTGGR 
YHAASITCVE SIEILRRARE AGLKVTASAS INHLTLNEND IGPYRSFLKL SPPLRTEDDR 
QALVAAVAAG LIDVIMSDHN PQDVEVKRLP FAEAAAGAIG LETMLPAGLR LIHSGELDFL 
TLIRAMSTKP AELLGLPGGT LRAGSPADLI VIDADVPWVV DPNELKSKCK NTPFDEAKFA 
GRVARTIVAG RTVYEHV