Gene RPC_4330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_4330
Symbol
ID	3971518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	-
Start bp	4827406
End bp	4828740
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	66%
IMG OID	637927439
Product	dihydroorotase
Protein accession	YP_534172
Protein GI	90425802
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.436145
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAAC GTTTCGATAC GATTCTGAAA TCCGGCACCA TCGTCAATCA AGACGGCGAG 
GGCACCGGCG ATATCGGCAT CACCGCCGGC AAGATCGCAG CGCTCGGCGA CCTCGGCCAG 
GCCTCGGCCG ACGAGCTGAT CGATTGCCGC GGCCTGCACG TGCTGCCCGG GGTGATCGAC 
ACCCAAGTGC ATTTCCGCGA GCCGGGATTG ACCCACAAGG AAGACCTGGA ATCCGGCTCG 
CTGAGCGCGG TGATGGGCGG CGTCACCGCG GTGTTCGAAA TGCCCAACAC CAATCCGTTG 
ACCGTCACCG CAGAGGCCTT TGCCGACAAG GTGAAGCGCG GTGAGCATCG CATGCATTGC 
GATTTCGCGT TCTACATCGG CGGCACCCGC GACAACGTCG CCGAGCTGCC GGACTTGGAG 
CGCGCCCGCG GCTGCGCCGG CGTCAAGGTG TTCATCGGCT CCTCCACCGG CAGCCTGCTG 
GTCGAGGACG ACGACAGCAT CCGCAAAATC CTGCAGGTGA TCCAGCGCCG CGCCGCGTTT 
CACGCCGAGG ACGAATATCG CCTCAACGAT CGCAAGGCGC TGCGCATCGA GGGCGATCCG 
CGCTCGCATC CGGTGTGGCG CGACGAGATC GCGGCATTGA CCGCAACGCA GCGCCTCGTG 
GCACTGGCGC GCGAGACCGG CAAGCGGATC CACGTGCTGC ACGTCTCGAC CAAACAGGAG 
ATCGAATTTT TGCGCGAGCA CAAGGATGTG GCTTCAGTTG AAGTGACGCC GCATCACCTG 
ACGCTGGCCG CGCCGGACTG CTACGAGCGG CTCGGCACGC TGGCGCAGAT GAATCCGCCG 
GTGCGCGACG CGGCGCATCG CGACGGCATT TGGCATGGCG TGGCGCAGGG CATCGTCGAC 
GTGCTCGGCT CCGACCACGC ACCGCACACG CTGGAAGAAA AATCCAAGAC CTATCCGGCG 
TCGCCGTCCG GCATGACCGG GGTGCAGACG CTGGTGCCGT TGATGCTGGA TCACGTCAAC 
GCCGGCAAAT TATCGCTGGC GCGATTCGTG GACCTCAGCA GCGCCGGCCC GGCGCGGCTG 
TTCAACATCG CCTGCAAGGG CCGCATCGCC GCGGGCTATG ACGCCGATTT CACGATCGTC 
GATCTGCAGC GCAGCGAGAC CATCAGCAAC GCCTGGACCG CATCGCGCGC CGGCTGGACG 
CCCTATGATG GGGTGACGGT GAAAGGCTGG CCGGTCGGCA CTTTCGTGCG CGGCGCCAAG 
GTGATGTGGC AGGGCGAATT GCTGACGCCG TCGACCGGCG AGCCGGTGCG GTTTCTGGAA 
ACGCTGGGGG CATAG

Protein sequence

MTQRFDTILK SGTIVNQDGE GTGDIGITAG KIAALGDLGQ ASADELIDCR GLHVLPGVID 
TQVHFREPGL THKEDLESGS LSAVMGGVTA VFEMPNTNPL TVTAEAFADK VKRGEHRMHC 
DFAFYIGGTR DNVAELPDLE RARGCAGVKV FIGSSTGSLL VEDDDSIRKI LQVIQRRAAF 
HAEDEYRLND RKALRIEGDP RSHPVWRDEI AALTATQRLV ALARETGKRI HVLHVSTKQE 
IEFLREHKDV ASVEVTPHHL TLAAPDCYER LGTLAQMNPP VRDAAHRDGI WHGVAQGIVD 
VLGSDHAPHT LEEKSKTYPA SPSGMTGVQT LVPLMLDHVN AGKLSLARFV DLSSAGPARL 
FNIACKGRIA AGYDADFTIV DLQRSETISN AWTASRAGWT PYDGVTVKGW PVGTFVRGAK 
VMWQGELLTP STGEPVRFLE TLGA