Gene Rsph17029_1820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1820
Symbol
ID	4896415
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	1919888
End bp	1921192
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	67%
IMG OID	640112414
Product	dihydropyrimidine dehydrogenase
Protein accession	YP_001043699
Protein GI	126462585
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01037] dihydroorotate dehydrogenase (subfamily 1) family protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.22065
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAACC TCCGTTCCGA CTTCATCGGC ATCAAGTCGC CGAATCCGTT CTGGCTCGCC 
TCGGCGCCGC CGACCGACAA GGAATACAAC GTCCGCCGCG CCTTCGAGGC CGGCTGGGGC 
GGCGTCGTCT GGAAGACGCT GGGCTCCGAA GGCCCGCCGG TCGTCAACGT GAACGGCCCC 
CGCTACGGCG CGATCTACGG CGCCGACCGG CGGCTCCTCG GGCTGAACAA CATCGAACTC 
ATCACCGACC GGCCGCTCGA GGTGAACCTG CGCGAGATCA AGTCGGTCAA GCGCGACTAT 
CCCGACCGCG CGCTGGTGGT CTCGCTGATG GTGCCCTGCG ACGAGGAAAG CTGGAAGGCG 
ATCCTCGCCC ATGTCGAGGA TACCGGAGCC GATGGCGTCG AGCTGAACTT CGGCTGCCCG 
CACGGCATGG CCGAGCGCGG CATGGGCTCG GCCGTGGGGC AGGTGCCCGA ATATATCGAG 
ATGGTCACGC GCTGGGTGAA GCAGCACAGC CGGATGCCCT GCATCGTGAA GCTCACGCCC 
AATGTGACCG ACATCCGCAA GCCGGCCGAA GCGGCCAGGC GCGGCGGCGC CGATGCGGTG 
AGCCTCATCA ACACGATCAA TTCGATCACC GGCGTGGACA TCGACAGTTT CGCGCCGATG 
CCCACCATCG ACGGCAAGGG CACCCATGGC GGCTATTGCG GTCCGGCGGT CAAGCCCATC 
GCGCTGAACA TGGTGGCCGA GATTGCGCGC AACCCCGAGA CGCACGGGCT GCCGATCTCG 
GGCATCGGCG GCGTCACCAC CTGGCGGGAT GCGGTCGAGT TCATGCTGCT CGGGGCGGGC 
AATGTGCAGG TCTGCACCGC GGCCATGACC TACGGCTTCC GCGTCGTGCA GGAGATGATC 
TCGGGCCTCT CCGACTACAT GGACGCCAAG GGCTTCGCCT CCACCGCCGA TCTCGTGGGG 
CGCGCGGTTC CGAACGTGAC CGACTGGCAG TATCTGAACC TCAACTATGT CACCAAGGCG 
CAGATCGACC AGGACCTCTG CATCAAGTGC GGCCGCTGCT ACGCCGCCTG CGAGGATACC 
AGCCACCAGG CCATCGCCAT GTCCACCGAT CGCACCTTCA CGGTGAAGGA CGAGGAATGC 
GTGGCCTGCA ACCTCTGCGT CGATGTCTGC CCGGTGGAGG ACTGCATCAC CATGCGCGAG 
CTGCCGAAGG GCGCGCTCGA TCCGCGCACG GGCCGGACGG TGGGGGACTA TGCCAACTGG 
CTGGGCCACC CGAACAACCC CTCGGTGCGC GAAGCCGCCG AGTGA

Protein sequence

MANLRSDFIG IKSPNPFWLA SAPPTDKEYN VRRAFEAGWG GVVWKTLGSE GPPVVNVNGP 
RYGAIYGADR RLLGLNNIEL ITDRPLEVNL REIKSVKRDY PDRALVVSLM VPCDEESWKA 
ILAHVEDTGA DGVELNFGCP HGMAERGMGS AVGQVPEYIE MVTRWVKQHS RMPCIVKLTP 
NVTDIRKPAE AARRGGADAV SLINTINSIT GVDIDSFAPM PTIDGKGTHG GYCGPAVKPI 
ALNMVAEIAR NPETHGLPIS GIGGVTTWRD AVEFMLLGAG NVQVCTAAMT YGFRVVQEMI 
SGLSDYMDAK GFASTADLVG RAVPNVTDWQ YLNLNYVTKA QIDQDLCIKC GRCYAACEDT 
SHQAIAMSTD RTFTVKDEEC VACNLCVDVC PVEDCITMRE LPKGALDPRT GRTVGDYANW 
LGHPNNPSVR EAAE