Gene Hlac_2077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2077
Symbol
ID	7400597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	2064441
End bp	2065763
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	72%
IMG OID	643709148
Product	dihydroorotase
Protein accession	YP_002566725
Protein GI	222480488
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.133238
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCATCA CGGGTGCGGA GCTGGCCGAC GGGCGGGTCC GCGACGTTCG GATCCGAGAC 
GGGACCATCG ACGCGGTCGA ACCGACGAAC GCGGGACTCG ACGCCGACAC CGGCGAGCGC 
GTCGTCGACG CGCGGGGACG CCACCTTCTC CCCGGCGCCG TCGACGTCCA CGTCCACTTC 
CGCGAGCCGG GCGCGAGCCA CAAGGAGACG TGGACCTCGG GCTCGCGGGG CGCGGCCGCG 
GGCGGCGTGA CGACGGTCGT CGACCAGCCG AACACCTCAC CCCCGACCGT CGACGGCGAC 
GCCTTCGACG AGAAGGCCGC CCTCGCCGCC GACTCGCTCG TCGACTACGG GATCAACGGC 
GGCGTCACCG CCGACTGGGA CCCCGAGAGC CTCTTCGAGC GCCCCCTGTT CGCGCTCGGC 
GAGGTGTTCC TCGCGGATTC GACCGGCGAC ATGGGGATCG CACTGGACCT GTTCGAGGAG 
GCGCTCGCCG AGGCCGCCGC CCGCGACGTT CCGGTCACGG TCCACGCGGA GGACGAGACC 
CTGTTCGATG AGAGTGCGCT CGACGGCGAC CTCGGGGGGG TCGGCACCGC CGCGAACGCC 
GACGCGTGGT CGGCCTACCG AACCGCCGAA GCGGAGACTG CGGCGATCGA GCGCGCCCTC 
GACGCCGGCG CAGAGAGCGA CGCGCAGGTG CATATCGCGC ACACGTCGAC GCCCGAGGGG 
ATCGACGCCG TGAGCGATAC CGACGCAACC TGTGAGGTGA CGCCGCACCA CCTCTTCCTG 
TCGCGCGAGG ACGCGGGGCG GCTCGGCACC TTCGGGCGCA TGAACCCGCC GCTCCGCTCG 
GAGGAGCGGC GCGCGGCCGT CTTCGAGCGG CTCCGCGACG GCGACGTCGA CGTGGTCGCC 
ACCGACCACG CGCCCCACAC GGTCGCGGAG AAGCGACAGA GGCTCGTCGA CGCGCCCAGC 
GGCGTTCCGG GCGTAGAGAC CCTCTATCCG CTTCTCTTGG AGTCCGTCCG CAAGGGGAAC 
CTCTCGTTGG AGCGCGTTCG CGACGTGGTC GCCGCCAACC CGGCGTCGAT CTTCGAGATC 
GAGGGGAAAG GGCGGATCGA ACCCGGCGCC GACGCCGATC TCGTCGTGGT CGATCTGACG 
AACCCCCGCG AGATCGAGGC CGGCGCGCTC CACGGCGCGT CCGGCTGGAC GCCCTTTGAG 
GGGTTACAGG GCGTCTTCCC GGAGCTGACG ACGGTCCGTG GCAAGATCGC CTACGAGCGC 
GATCCGGTCA CCGGCGCGGA GTCGTTCGGC GAGACAGTCG GTCGAAACGT GCGAGAGTCG 
TAA

Protein sequence

MLITGAELAD GRVRDVRIRD GTIDAVEPTN AGLDADTGER VVDARGRHLL PGAVDVHVHF 
REPGASHKET WTSGSRGAAA GGVTTVVDQP NTSPPTVDGD AFDEKAALAA DSLVDYGING 
GVTADWDPES LFERPLFALG EVFLADSTGD MGIALDLFEE ALAEAAARDV PVTVHAEDET 
LFDESALDGD LGGVGTAANA DAWSAYRTAE AETAAIERAL DAGAESDAQV HIAHTSTPEG 
IDAVSDTDAT CEVTPHHLFL SREDAGRLGT FGRMNPPLRS EERRAAVFER LRDGDVDVVA 
TDHAPHTVAE KRQRLVDAPS GVPGVETLYP LLLESVRKGN LSLERVRDVV AANPASIFEI 
EGKGRIEPGA DADLVVVDLT NPREIEAGAL HGASGWTPFE GLQGVFPELT TVRGKIAYER 
DPVTGAESFG ETVGRNVRES