Gene Saro_0935 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Saro_0935
Symbol
ID	3918021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Novosphingobium aromaticivorans DSM 12444
Kingdom	Bacteria
Replicon accession	NC_007794
Strand	+
Start bp	982797
End bp	983837
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	66%
IMG OID	640443669
Product	dihydroorotase
Protein accession	YP_496214
Protein GI	87198957
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0418] Dihydroorotase
TIGRFAM ID	[TIGR00856] dihydroorotase, homodimeric type

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGAGA CGCTGACGAT CCGCCGCCCC GACGACTGGC ATGTCCACCT GCGCGACCGC 
GACGTACTGC GGGGCGTCGT TCCCTATACC GCCCGGCAGT TTGCCCGCGC CATCGTCATG 
CCCAACCTTT CGCCGCCGAT GACCGACGTT GCGGGCGTTG CCGCCTATCG CGATCGCATC 
CTTGCCGCCC TGCCGCAGGG TAGCGCCTTC ACGCCGCTGA TGACGCTGTA CCTTACCGAT 
TCGACCGACA TCGAAGAGGT TGCGCGCGGC TTTGCCGAAG GCGTGTTCGT CGCCGCCAAG 
CTCTATCCAG CCCATGCGAC GACCGGTTCC GCGCACGGCG TCACCGACAT CCGCAACATC 
TATCCGGTGC TGGAGAAGAT GCAGGAGATC GGGATGCCAC TGCTGATCCA CGGCGAGGTG 
ACCGATTCCC ATGTCGACAT CTTCGACCGC GAAGCCGTGT TCATCGAGCG GACGCTGACC 
CGCCTCGTGG CCGACATGCC GGCCCTTCGC ATCGTCTTCG AGCATATCAC GACCGAGGAG 
GCGGCCCAGT TCGTGGAAGG CGCGGGCGAC AGCATCGCCG CGACGATCAC GCCGCAGCAT 
CTCCACATCA ACCGCAACGC CATGCTCGTC GGCGGCATCC GTCCGCACGC CTTCTGCCTG 
CCGGTCGCCA AGCGCGAGAA GCACCGGCTT GCCCTGCGCA AGCTTGCCAC CTCGGGCTTT 
TCGCGGGTGT TCCTGGGAAC CGATACCGCG CCTCATGCCA AGCACCTGAA GGAAGCGGCA 
TGCGGCTGTG CGGGGATATT CAACGCGCCC TTCGCGCTCG AAAGCTATGT CACGGTCTTC 
GACGAGGAAG GCGCGCTCGA CCGGTTCGAG GCCTTTGCCT CGCTCAACGG GCCCGCGTTC 
TACCGGATGC CGGTGAACGA GGACCGCATC GTGCTGGAAA GGGCGCCCAT CGAGGTGCCT 
GAGGTGATCG ACTGCAACGG CACCGCAATC GTGCCCTTCC ACGCCGGTGA GACGCTCGGC 
TGGCGAATCG CCGCGGCCTG A

Protein sequence

MTETLTIRRP DDWHVHLRDR DVLRGVVPYT ARQFARAIVM PNLSPPMTDV AGVAAYRDRI 
LAALPQGSAF TPLMTLYLTD STDIEEVARG FAEGVFVAAK LYPAHATTGS AHGVTDIRNI 
YPVLEKMQEI GMPLLIHGEV TDSHVDIFDR EAVFIERTLT RLVADMPALR IVFEHITTEE 
AAQFVEGAGD SIAATITPQH LHINRNAMLV GGIRPHAFCL PVAKREKHRL ALRKLATSGF 
SRVFLGTDTA PHAKHLKEAA CGCAGIFNAP FALESYVTVF DEEGALDRFE AFASLNGPAF 
YRMPVNEDRI VLERAPIEVP EVIDCNGTAI VPFHAGETLG WRIAAA