Gene Daci_3988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daci_3988
Symbol
ID	5749571
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Delftia acidovorans SPH-1
Kingdom	Bacteria
Replicon accession	NC_010002
Strand	+
Start bp	4393591
End bp	4394637
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	66%
IMG OID	641299086
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_001565004
Protein GI	160899422
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.055299
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.021613
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTCTGA TCCCCTACGC CCTGACCCGT CCCTTTCTCT TCGGCATGGA CCCCGAATCC 
GCCCACGATC TCACGATGAA CCTGATGGCA AAGGGGCAGA ACACGCTCCT GCAGCAGGCG 
TGGGCACAGC CCATGGTGAG TGACCCCGTC GAGCTTGCCG GCCTCAAGTT CCCCAACCGC 
GTGGGCATGG CAGCGGGTCT GGACAAGAAT GCACGCTGCA TCGACGCGCT GGCCGCCATG 
GGCTTCGGCT TCGTCGAGGT GGGCACCGTG ACACCCCGCC CGCAGCCGGG CAACCCCAAG 
CCGCGCATGT TCCGCATTCC CGAACGCAAT GCGCTGATCA ACCGCCTGGG CTTCAACAAC 
GAAGGCCTGG ATGCCTTCCT GAGCAACGTC AAGCGCTCGC AGGCCCGCGC GCAGGGCAAA 
CCCATGCTGC TGGGGCTGAA CATCGGCAAG AACGCGACCA CTCCCATCGA AGATGCCACC 
AGCGACTATC TCAAGGCGCT GGACGGCGTG TACCCGCATG CCGACTACGT GACGGTGAAC 
ATCAGCTCGC CCAACACCAA GAACCTGCGC GCCCTGCAAA GCGACGAAGC GCTGGACGCC 
CTGCTGGGTG CGATTGCCGA GCGCCGTGAG CAACTGGCCA CGCAGCATGG CAAGCGGGTG 
CCGGTGTTCG TGAAGATCGC ACCCGACCTG GATGAAGAGC AGGTCGGCGT CATCGCCGCC 
ACGCTGCAGC GCCATGGCAT GGATGGCGTG ATCGCCACCA ACACCACGAT CAGCCGGGAA 
GCCGTCAAGG GCCTCCCCTA CGCGCAGGAA ACGGGCGGCC TGTCCGGTGC GCCGGTGCTG 
GAGGCCAGCA ACCAGGTCAT CCGCCAGCTG CGTTCCGCCC TGGGCAGCCG CTACCCCATC 
ATCGGCGTGG GCGGCATTCT CAGCGGCGAA GATGCCGTCA GCAAAATTCG CGCAGGCGCC 
GACGTGGTCC AGATCTACAG CGGCCTGATC TACCGAGGCC CTGCCCTGGT GCCCGAGACC 
GCACGCGCCA TAGCCCAGCT GCGTTGA

Protein sequence

MSLIPYALTR PFLFGMDPES AHDLTMNLMA KGQNTLLQQA WAQPMVSDPV ELAGLKFPNR 
VGMAAGLDKN ARCIDALAAM GFGFVEVGTV TPRPQPGNPK PRMFRIPERN ALINRLGFNN 
EGLDAFLSNV KRSQARAQGK PMLLGLNIGK NATTPIEDAT SDYLKALDGV YPHADYVTVN 
ISSPNTKNLR ALQSDEALDA LLGAIAERRE QLATQHGKRV PVFVKIAPDL DEEQVGVIAA 
TLQRHGMDGV IATNTTISRE AVKGLPYAQE TGGLSGAPVL EASNQVIRQL RSALGSRYPI 
IGVGGILSGE DAVSKIRAGA DVVQIYSGLI YRGPALVPET ARAIAQLR