Gene Hoch_3948 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hoch_3948
Symbol
ID	8546344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haliangium ochraceum DSM 14365
Kingdom	Bacteria
Replicon accession	NC_013440
Strand	-
Start bp	5446016
End bp	5447344
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	72%
IMG OID	646388620
Product	dihydroorotase, multifunctional complex type
Protein accession	YP_003268340
Protein GI	262197131
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.121756
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0185231
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTCC TACTTCGTGG TGGTCGCGTC ATCGATACTT CTGGCGAGGC GGCAGGTGGT 
GGCTCCGGTC GCGCGGTGCT CGACGCCGCC TGTGACGTGC TCGTGCGCGA CGGACGCATC 
GTCGAGATCG GCCGCGGCCT GGCCGCGCCC AGCGGCGTGC GCGAGCTCGA TCTCGCCGGC 
AAGCTGGTGT GCGCCGGTCT GGTCGACCTG CACGTGCACT TCCGCGAGCC CGGCCACGAG 
TACAAGGAAG ACATCGCCAG CGGCTCGGCC ACGGCCGCGG CCGGCGGCTT CACCACCGTG 
TGTTGCATGC CCAACACCAA GCCGGTCAAC GACTGCCGCG CGGTCACCGA TCTCATCGTC 
CGGCGCGCGC GCGAGGCCGG CCTGTGCCGC GTGCGCCCGG TCGGCGCCAT CTCGCGCGGG 
CTGGCCGGCG AGGCCCTGGC CGAGATCGGC GAGATGCGCG ACGCGGGTAT CGTCGCGGTG 
TCCGACGACG GCATGCCGGT GATGAACGCC GGCCTGATGC GCCGCGCGCT CGAGTACGCG 
CGCACCTTCG ATTTGCCCGT GGTGCAGCAC GCCGAGGATC TCGACCTGGC CGAGGGCGGC 
GCCATGAACG AGGGCGAGGT GGCCACCCGC ATCGGCGTGC GCAGCCAGCC CGCGCAGGCC 
GAGTCGGTCA TGGTCGCGCG CGACATCGAG CTGGTGTCGT GGACCGGGGC CCGCTACCAC 
GTCGCCCACA TCTCGGCCGC GCGCTCGGTC GATCTCGTGC GCGAGGCCAA GCGCCGCGGG 
CTGCCGGTGA GCTGCGAGGT CACGCCGCAC CACTTCGCGC TCACCGACGA GGCCTGCGCC 
AGCTACGACA CCCACGCCAA GTGCATGCCG CCGCTGCGCA CGCAGGCCGA TCTCGACGCC 
ATCAAAGAGG GCATGGCCGA CGGCACCATC GACTGCATCG CCACCGACCA CGCGCCGCAC 
TCCGAGGTCG AGAAAGAGAT CGAGTTCGAG CTGGCGGCGC CCGGCATGAT CGGCCTCGAG 
ACCGCGGTGC CGCTCACCCT CGGCCTGGTG CGCGAGGGCG TCATCGACCT CGTGCGCGCG 
GTGCACATGC TCACCGCGGC GCCGGCGCGG CTGTTCTCGA TGGACCGCGA GGGCGTGGGC 
GCGCTGGCCG CCGGACGGGT GGCCGATCTG TGCGTCATCG ACCCCGAGCG CGAGCTGCAG 
GTCGATCGCA CCGCCAGCCG CAGCAAGTCG TACAACACGC CCTTTCACGG CCAGGCGATG 
CGCGGCGTCG CCGTGCTGAC CCTGCTCGGC GGCCGGGTGG TCTACGATCG CGAGGAGATG 
CTGTCATGA

Protein sequence

MDLLLRGGRV IDTSGEAAGG GSGRAVLDAA CDVLVRDGRI VEIGRGLAAP SGVRELDLAG 
KLVCAGLVDL HVHFREPGHE YKEDIASGSA TAAAGGFTTV CCMPNTKPVN DCRAVTDLIV 
RRAREAGLCR VRPVGAISRG LAGEALAEIG EMRDAGIVAV SDDGMPVMNA GLMRRALEYA 
RTFDLPVVQH AEDLDLAEGG AMNEGEVATR IGVRSQPAQA ESVMVARDIE LVSWTGARYH 
VAHISAARSV DLVREAKRRG LPVSCEVTPH HFALTDEACA SYDTHAKCMP PLRTQADLDA 
IKEGMADGTI DCIATDHAPH SEVEKEIEFE LAAPGMIGLE TAVPLTLGLV REGVIDLVRA 
VHMLTAAPAR LFSMDREGVG ALAAGRVADL CVIDPERELQ VDRTASRSKS YNTPFHGQAM 
RGVAVLTLLG GRVVYDREEM LS