Gene Hlac_0019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0019
Symbol
ID	7401367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	18147
End bp	19229
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	64%
IMG OID	643707073
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_002564695
Protein GI	222478458
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.146471
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.113107
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGTGC GTGACGAGAC CGAAACGATG GGCGCGTACG ATCTCTTGAA GCCGGCACTG 
TTCGGACTTC CCCCGGAGAC GGCACACGGG CTGACACACC GACTGTTACG TGCGGTGCAA 
ACCACACCGG TGACTGAACA CCTCCACAGC CGGTTCTCCG TGAACGATCC TCGTCTGCGC 
GTTGAGGCAT TCGGGAACGA GTTTCCCAAT CCCGTGGGCG TCGCGGCCGG CTTCGACAAG 
AATGCTGAGG TCCCGCGCGG CCTCGCAGCG CTGGGGTTCG GTCACGTCGA GGTCGGCGGC 
GTCACCGCTG AGCAACAGCC GGGGAATCCG CGACCGCGAC TGTTTCGGCT GCGCGAGGAC 
GAAGCTCTCA TAAACCGGAT GGGGTTCAAC AACGAGGGTG CCGACATCGT CGGCGAACGG 
CTCGATCGGG AGCCGCTGCC GGAGATTCCG GTTGGAATCA ACATCGGGAA GTCGAAGTCG 
ACACCCCTCG CCGAGGCCCC CGAGGACTAT CTATATACCT ACGAGCGCGT GGCGGACGCC 
GGCGACTACT TCGTTGTTAA CGTCTCCAGC CCGAACACGC CCGGTCTCCG CGAACTGCAG 
AACCGCGCGG CGTTAGAGGA GATACTTGGC ACTCTTACGG ACGCGGGCGC CGATCCTCTC 
CTTGTAAAAC TCTCCCCGGA CCTCCCGGAG CCAGCAGTCG AGGACGCGCT CGGAGTCGTC 
GACGATCTCG GTCTCGACGG CGTCATCGCA ACCAACACCA CGACATCGCG TCCGAACTCT 
CTAAAAAGTC CCCAGCAGGC TGAGCGCGGT GGACTCTCGG GGAAGCCGAT AGAGCCGATC 
GCCACGGAGC GGGTCCGGTT CGTTGCCGAG CGCACCGACG TTCCGGTGAT CGGGGTCGGC 
GGAATCTCGG ACGCGAAGGG TGCCTACGAG AAGATACGGG CGGGCGCGTC CCTCATCCAG 
TTGTACACAG GGCTCGTCTA CGAGGGGCCG GGCCTCGCAC GCGACATCAA CGGGGGGGTC 
CTCGATCTCC TCGATCGGGA CGGCTTCGAC TCGGTCGAGG CCGCTGTCGG CGCGGATCTA 
TAG

Protein sequence

MPVRDETETM GAYDLLKPAL FGLPPETAHG LTHRLLRAVQ TTPVTEHLHS RFSVNDPRLR 
VEAFGNEFPN PVGVAAGFDK NAEVPRGLAA LGFGHVEVGG VTAEQQPGNP RPRLFRLRED 
EALINRMGFN NEGADIVGER LDREPLPEIP VGINIGKSKS TPLAEAPEDY LYTYERVADA 
GDYFVVNVSS PNTPGLRELQ NRAALEEILG TLTDAGADPL LVKLSPDLPE PAVEDALGVV 
DDLGLDGVIA TNTTTSRPNS LKSPQQAERG GLSGKPIEPI ATERVRFVAE RTDVPVIGVG 
GISDAKGAYE KIRAGASLIQ LYTGLVYEGP GLARDINGGV LDLLDRDGFD SVEAAVGADL