Gene Rsph17025_0222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_0222
Symbol
ID	5083770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	215374
End bp	216648
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	71%
IMG OID	640481777
Product	dihydroorotase, multifunctional complex type
Protein accession	YP_001166437
Protein GI	146276278
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.357972
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTGT TCCTGACCAA CGCCCGCCTG ATCGACCCCG AGGCCGGGAC CGAGACCGAG 
GGCGACCTGC TGATCGAGGG CGGGCTCATC GCCGCCGTGG GCGCGCTCGA GCCGCCACCC 
GGCACCGAGG TGATCGACTG CGGCGGCAAG TGCCTCGCGC CCGGCATTGT CGATCTGGGC 
GTGAAGGTGG GCGAGCCCGG CGAGCGCCAC CGCGAGAGCT TCCGCTCGGC GGGCCTGGCC 
GCGGCCGCGG GCGGCGTCAC CACGATCATC GCCCGCCCCG ACACGATGCC CGCCATCGAT 
ACGCCCGAGG TGCTGGAATT CGTCACCCGC CGCGCCGCCG AGGCGAGCCC GGTCCGCATC 
CGCCACATGG CGGCGCTGAC GAAGGGCCGC GAGGGGCGCG AGATGGTCGA GCTGGGCTTC 
CTGCTCGACA CGGGCGCCAT CGCCTTCACC GACTGCGACC ATGTGATCGA GACCACCAAG 
GTCGCCGCGC GCTGCATGAC CTATGCCCGC AGCCTCGGCG CGCTGGTGAT CGGCCATCCG 
CAGGATCCGG GCCTCTCGGC GGGCGCCTCG GCCACCAACG GCAAGTTCGC CAGCCTGCGC 
GGCATCCCCG CCGTTCATCC AATGGCCGAG CGCATGGGCT TCGACCGCGA CATGGCGCTG 
GTCGAGATGT CGGGCGTGCG CTACCACGCC GACCAGGTCA CCACCGCCCG CACCCTGCCC 
GCGCTCGAGC GGGCCAAGCG CAACGGCCTC GATGTGACGG CCGGCATCGG CATCCACCAC 
CTGACGCTGA ACGAGTTCGA CGTCGGCGAC TACCGCACCT TCTTCAAGCT GAAGCCGCCG 
CTGCGCTCGG AGGAGGATCG GCTGGCCATG GTCGAGGCGG TGGGATCGGG TCTGATCGAC 
ATCATCTCCT CGATGCACAC GCCGCAGGAC GAGGAATCGA AGCGCCTGCC CTTCGAAGAG 
GCCGCCTGGG GCGCGGTGGC GCTCGAAACC TTCCTGCCCG CGGCGCTCCG GCTCCATCAC 
GCGGGCCTCC TGAGCCTGCC GCAGCTCTTC CGGGCGATGG CGCTCAACCC GGCGAAGCGG 
CTCGGCCTGC CGCAGGGGCG GCTCTCCGAG GGGGCACCCG CCGACCTCGT GCTCTTCGAC 
CCCGATGCCC CCTTCGTCCT CGACCGCTTC ACCCTGCGGT CGAAATCGAA GAACACGCCC 
TTTGACGGGC AGCGGATGGA GGGGCGCGTG CTGGCGACCT TCGTCGGCGG CCGGCAGGTC 
TTTGCGGTCG AGTGA

Protein sequence

MSLFLTNARL IDPEAGTETE GDLLIEGGLI AAVGALEPPP GTEVIDCGGK CLAPGIVDLG 
VKVGEPGERH RESFRSAGLA AAAGGVTTII ARPDTMPAID TPEVLEFVTR RAAEASPVRI 
RHMAALTKGR EGREMVELGF LLDTGAIAFT DCDHVIETTK VAARCMTYAR SLGALVIGHP 
QDPGLSAGAS ATNGKFASLR GIPAVHPMAE RMGFDRDMAL VEMSGVRYHA DQVTTARTLP 
ALERAKRNGL DVTAGIGIHH LTLNEFDVGD YRTFFKLKPP LRSEEDRLAM VEAVGSGLID 
IISSMHTPQD EESKRLPFEE AAWGAVALET FLPAALRLHH AGLLSLPQLF RAMALNPAKR 
LGLPQGRLSE GAPADLVLFD PDAPFVLDRF TLRSKSKNTP FDGQRMEGRV LATFVGGRQV 
FAVE