Gene Saro_0193 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0193
Symbol
ID	3916181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	-
Start bp	199866
End bp	200915
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	68%
IMG OID	640442919
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_495476
Protein GI	87198219
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGCCAT ACTCGCTACT GCGCCCCCTC ATCTTCCGCA TTCCCGCAGA ACCCGCGCAC 
CGCCTGACGA TAAAGGCCCT GGGCCTTGCG CAAGGCGGGA CCACGCTGGC GCCCACGCCT 
TCGCTCGCCC AGCGCATAGC GGGACTGGCC TTTCCCAACC CGGTCGGCAT GGCCCCCGGT 
TTCGACAAGA ACGCGGAAGT GCCCGATGCC ATGCTCGGCC TCGGCTTCGG ATTCGTCGAA 
GTGGGCACGG TCACGCCCCG CCCGCAGGAG GGCAACCCCA AGCCGCGCCT GTTCCGCCTG 
GTCGAGGACC GCGCGGTCAT CAACCGCATG GGCTTCAACA ACGAAGGCGC GCAGGCCGTC 
ACCAACCGCC TCGTGCGGCG ACGCGAGACT GGCAAGCACG GCTTGCCGGG CATCGTCGGC 
GTGAACATCG GCGCGAACAA GGATTCGGCG GACCGAATCG CCGACTATGC GCTGATGACG 
CGGCTGATGG CGCCGCTGGC CTCGTACCTC ACCGTCAACA TCTCATCGCC GAATACGCCG 
GGCCTGCGCG CCCTGCAGGA CGAAGGCGCC CTTGCCGCAC TGCTCGATGC AGTGATCGAG 
GCGCGTGGCA ACATGACCAC GCCGGTGTTC CTCAAGCTCG CGCCCGATCT CGAGCCGGCC 
GATATCGACA GCATCTGCCG CATCGCCATC GAAAAGCAGC TTGCGGCCCT GATCATCTCG 
AACACGACGA TCACCCGGCC AGTGCTCCGC TCTGCCCACG CCGGGGAGGC GGGCGGACTT 
TCCGGCGCAC CGCTGCGGGA ACTGGCGCTG CAGCGCCTGC GCGATTTCCG CAAGGCCAGC 
GGCGGGGCGA TCCCGCTGGT CGGCGTAGGC GGCATTGCCA CGGTCGACGA TGCGTGGGAG 
CGGATCCGGG CAGGCGCCAG CCTGATCCAG ATCTACAGCG CCATGGTCTA CGAAGGGCCC 
GGCCTGGCCC GCCGCCTCGT TGCGGGTCTC GAGCGCAAAG TCCGCGAAGC CGGCCTCACT 
TCCATTGCCG AGGCCGTCGG CAGCGAATAG

Protein sequence

MTPYSLLRPL IFRIPAEPAH RLTIKALGLA QGGTTLAPTP SLAQRIAGLA FPNPVGMAPG 
FDKNAEVPDA MLGLGFGFVE VGTVTPRPQE GNPKPRLFRL VEDRAVINRM GFNNEGAQAV 
TNRLVRRRET GKHGLPGIVG VNIGANKDSA DRIADYALMT RLMAPLASYL TVNISSPNTP 
GLRALQDEGA LAALLDAVIE ARGNMTTPVF LKLAPDLEPA DIDSICRIAI EKQLAALIIS 
NTTITRPVLR SAHAGEAGGL SGAPLRELAL QRLRDFRKAS GGAIPLVGVG GIATVDDAWE 
RIRAGASLIQ IYSAMVYEGP GLARRLVAGL ERKVREAGLT SIAEAVGSE