Gene Saro_3062 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_3062
Symbol
ID	3916676
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	3280706
End bp	3281935
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	71%
IMG OID	640445844
Product	dihydroorotase
Protein accession	YP_498331
Protein GI	87201074
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCGCGC AGCCTCTCAC GATCATAGGC GGCCGGCTGG TGCCGGGCTC GGGCGAGCCG 
GTCGCCGGGA ACCTGCGCTG CGAGGGCGGA CGCATCGTCG CGCTGGGCGA TGTGGCGCCG 
CAGGACGGCG ACACGGTGTT CGACGCCGGG GGCGCGCTGG TCGCGCCGGG GCTGGTGGAC 
CTCGGCGTCT TCGCGGTCGA CAAGCCCGCG TTCCATTTCG GCGGGATCAC GCGCGCGGCG 
CTCATGCCCG ACCAGGCGCC GCCGCTCGAC CATCCGGCGC GGGTGCGCTT CGCCGCACAG 
TCGGGCAAGC CGGACATGTG GGTCCACCCG CTGGCCGCCG CAACGCGCGG GCTGGAAGGA 
ACGGAGTTGG CCGAACTGGC GCTGATGCGC GACGCGGGCG CCAAGGCTGT CTCCACCGGA 
CGGGCATGGA TCGGCGATTC AGGCGTGATG CTGCGCCTGC TGCGCTACTG CGCGATGCTG 
AGGCTGGTCG TGGTCACGCA TGCAGAGGAT GCGGCGATAA CCGGATCGGC CGTCGCGACG 
GCAGGCGAGG TGGCGACGCG ACTCGGCCTG CCGAGCGCGC CGGCCGAGGC CGAAGCGCTG 
GCCGTGGCTC GCGACATCGC GCTTGCCGAA ATGTCGGGCT GCCACGTCCA TTTCCGGCAG 
GTGACGACGG CGCAGGCGCT GGATCTCGTG CGGACGGCCA AGGCGCGCGG CGTGCGCGTG 
ACGGCAGGGG TCACGCCTGC GCACTTCGTC CTTTCCGATC TCGAACTCGT CGGCTTCCGC 
ACCTTCTGCC GTCTCTCGCC GCCGCTGCGC TCGGACGCGG ATCGCAAGGC CGTGATCGCG 
GCGATTGCCG ATGGCACCAT CGACGTCATC GCATCGGGTC ACGACCCGCG CGGGCCGGAA 
GACAAGCGCC TCCCCTTTGC CGACGCGGAG CCCGGCATGG CGGGCGCCGA AACGCTCCTG 
CCGCTTACCT TGACGCTCGT GCGCGACGGC GTGATCGATC TGGCACGCGC GTTCGAGCTG 
CTCGCCGGAA ACCCGGCGCG GCTACTGGGG GTCGATGCCG GACGACTCGA GACAGGGGCC 
GAGGCCGACA TCGCGATCGT CGATCCGGCG CGGCCGTGGA TCGTCAATTC GGGCAAGATG 
GCCGCCAGCG CCGGAAACAC CCCGTTCGAC CGACGACCCG TCGAAGGCCG GGTCACCGCG 
CTGTTCAAGG GCGGCAAGCA GGTCCACTGA

Protein sequence

MIAQPLTIIG GRLVPGSGEP VAGNLRCEGG RIVALGDVAP QDGDTVFDAG GALVAPGLVD 
LGVFAVDKPA FHFGGITRAA LMPDQAPPLD HPARVRFAAQ SGKPDMWVHP LAAATRGLEG 
TELAELALMR DAGAKAVSTG RAWIGDSGVM LRLLRYCAML RLVVVTHAED AAITGSAVAT 
AGEVATRLGL PSAPAEAEAL AVARDIALAE MSGCHVHFRQ VTTAQALDLV RTAKARGVRV 
TAGVTPAHFV LSDLELVGFR TFCRLSPPLR SDADRKAVIA AIADGTIDVI ASGHDPRGPE 
DKRLPFADAE PGMAGAETLL PLTLTLVRDG VIDLARAFEL LAGNPARLLG VDAGRLETGA 
EADIAIVDPA RPWIVNSGKM AASAGNTPFD RRPVEGRVTA LFKGGKQVH