Gene Hlac_1099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1099
Symbol
ID	7400171
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	1103565
End bp	1104956
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	65%
IMG OID	643708165
Product	amidohydrolase
Protein accession	YP_002565764
Protein GI	222479527
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACACG ATCTCGTCAT CGCGAACGGC ACCGTCGTCA CGCCCGAACT CGGCGCCTTC 
GAGGCCGATG TGGCCGCCGA CGGCGACGAG ATCGCCGCGA TCGCGAGTTC GGGGACTCTC 
TCCGGCGACC GCGTGATCGA CGCCGAGGGG AAGTACGTCC TCCCGGGCGC GATCGACCCG 
CACACTCACC ACGGGATCTA CCGCGGGCTC GAAGCCGACG CCGAGACGGA GTCGCGCTCC 
GACCTCGTCG GCGGCGTCAC GACTATCGGG AACTACTTCC GGCGGGGCGG CTCCTACGAG 
GAGATCATGG AGGGCTACTT CGCCGAGGCG GAGCCGAACT ACTACCACGA CTACTTCTTC 
TCGTTGGGAC TGCTCTCGTT CGAGCACATC GAGGAGATTC CGTACATCGT CGAGGAGTTG 
GGGATTACGT CGTTCAAGTG GTACAAGAAC TACAAAGACG TCGCGCCTGA GAAGTTCGGC 
ACCGACTCCG AGATGCACGA CGACTGGGCG GACGCGTTCA TTCAGGCGCT CGCCGCGCAG 
GACGTGCCCA CGACGCTCGG CCACCACTCC GAGAACATGG AGATCACGAG CGCGCTCGGC 
GACAACCCGT ACCTCGACTC CGCGGTCGAC GAGGACCAGG AGTACCGCGA CTACGACGTG 
TTGGTCGACC AGTTCCCGGA CTACGCGGAG ACGCAGAGCA TGACCGCGAG CGGCTCGTTA 
GCCCGGCAAC ACGACTACGA CGACAGCTTC TACGCGGTCC ACATTTCGGC CGGACGGACC 
GCGGACGAGC TGGCGATGCT CCACGACGCG GGGTGGGATA TCACCGGGGA GACGTGTACC 
CACTACCTGA CGCTCACCGC CGAGGAGTGC GACGAGCGCC ACAACGTCAA TCCGCCGGTG 
CGGTCGAAAG AAGACCAGGA GACGCTGTGG AAGCGCGTCG CCGACGGCAC GATCTCCTGT 
ATCGGCACCG ACCACTGCGC GAACCTGCGC GACGACAAGG TCGGCGAGGA CGTGCCAGAC 
AGCCTCCCCG GCTTCCCCTC GACGGCGACG ATGCTCCCGC TGATCCTCTC GGAGGGGGTC 
AACGAGGGAC GCATCTCGCT CGAACGCGCG GTCGAGGTGA CTTCCACGAA CACCGCGAAA 
GCGTTCGATA TATATCCGAA GAAAGGCTCC GTTCAGGTCG GAACCGATGC GGACCTGACG 
GTCGTCGACC TCGACGAGAC GAAGACGGTG ACCCCGGAGC TGCTCCGCAG CGGTGCGGAC 
TACTCCCCGT ACGAGGGGCG CGAGGTGACC GGGTGGCCGA CGCACACGGT CGTTCGCGGT 
CAGGTCGCCT ACGAGGAGGG CGAGATCGTC GGCGAGTCGG GGTACGGAAC CCACATCGAT 
CGCCCAATCT GA

Protein sequence

MTHDLVIANG TVVTPELGAF EADVAADGDE IAAIASSGTL SGDRVIDAEG KYVLPGAIDP 
HTHHGIYRGL EADAETESRS DLVGGVTTIG NYFRRGGSYE EIMEGYFAEA EPNYYHDYFF 
SLGLLSFEHI EEIPYIVEEL GITSFKWYKN YKDVAPEKFG TDSEMHDDWA DAFIQALAAQ 
DVPTTLGHHS ENMEITSALG DNPYLDSAVD EDQEYRDYDV LVDQFPDYAE TQSMTASGSL 
ARQHDYDDSF YAVHISAGRT ADELAMLHDA GWDITGETCT HYLTLTAEEC DERHNVNPPV 
RSKEDQETLW KRVADGTISC IGTDHCANLR DDKVGEDVPD SLPGFPSTAT MLPLILSEGV 
NEGRISLERA VEVTSTNTAK AFDIYPKKGS VQVGTDADLT VVDLDETKTV TPELLRSGAD 
YSPYEGREVT GWPTHTVVRG QVAYEEGEIV GESGYGTHID RPI