Gene Hlac_2163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2163
Symbol
ID	7401096
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2151241
End bp	2152470
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	70%
IMG OID	643709233
Product	hypothetical protein
Protein accession	YP_002566810
Protein GI	222480573
COG category	[R] General function prediction only
COG ID	[COG2404] Predicted phosphohydrolase (DHH superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.491692
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGACG AACTCATCGA CGAGGCGGAT ATCCCCCGTT CGCGGTACAC GCGACTGCCG 
GGAAAGGGCT TTTTCTACCC GGACTCGCTG GACGACGAGC GCGCCGAGAC GCGAGCGAAA 
GAGGTCATCG AGGGGAGCGA GGCGATCGTG ATCGCCGACG GCGACGCCGA CGGGCTCGCC 
TGCGCGGCGA TGGTCCGAGA GGCGTACGAC GCCGCGCTCG ACGCCGCGGA CTTCGAGGCG 
GCCATCACGG CGCGGCTCGG CGACGGTGAG AGCGAGGCCG ACGACGGTGA TAGCGAGGAC 
GACCCCACCG AGAACGCCCA CACGCAGTCG TCGGTCGGGC TGATCGCCGC CGGGCCGTAC 
TCCATCGACA CGTCGCTCGA ACGCGTGCTC GCGTACGCCG ACGACGACGT GGACCTGTTC 
GTCTGTGACC TCTGTCCCGA CGACTACAAG TGGATCGCCG AGCCGCTGGA GGCGCTCGCC 
GAGTCGACCG CCTCGATCCG GTGGTTCGAC CACCACCAGT GGGACGAGTC GACGGCCGCC 
GCCGTCCGCG ACCTCGGCGT CGACCTCGTC GTCGGCGAGT CCGACGAGGA GTGTACCGCC 
GACGTGGCGC TCCGCTCGCT CGATCACGAC TTCGACGACC GGTGGGCCGA GCTGGCGGTC 
GTGACGCGAG ACCACGACCT CTGGATCAAG GAGGACTCGC GCTCCGACGA CTTGGCCGAC 
TACTCCTACT GGGCCGGCAG CGAGGAGTAC ACGACGATCG TGGGCGCGTA CGGCGCCGAT 
CTCCCCGAAA CGGTCCGAGA GTTCGTCGCC GATCGGCGCG TCGAGAAGGA CGCTCGGATC 
GACGCCGCCG TCGACCGCGC GGTCACCCAC GACATCGGCG AGTGGACCGT CGCGGTGACG 
TACGGCCGCT GCTCGCAGAA CGAGGTCGCC GAGGCCCTTC GCGAGCAGGG TGCCGACGGC 
GCCGTGATCG TCAAGCCCGC CGGCTCCGCG TCGATCCGCG GCTCCGAGGA CTTCCAGCAC 
GCCCACGAGG TCGCCGGGAA GGTGAACGGG GGCGGCCACC CGCAGGCGGC CGGCTGCAAG 
CCCGACATCT ACGACGACAT GCTCGACTAC GCACAGCACT GGACGACCGA GGGGCAGGCC 
TGCAAGCGGG TCATCCTCGC GGCGTTCGAG GCGGTCGCGG AAGAGGTCGC GGCGGCGGAC 
GAGTCGGACG AGACCGAAAC CGACGAGTAG

Protein sequence

MDDELIDEAD IPRSRYTRLP GKGFFYPDSL DDERAETRAK EVIEGSEAIV IADGDADGLA 
CAAMVREAYD AALDAADFEA AITARLGDGE SEADDGDSED DPTENAHTQS SVGLIAAGPY 
SIDTSLERVL AYADDDVDLF VCDLCPDDYK WIAEPLEALA ESTASIRWFD HHQWDESTAA 
AVRDLGVDLV VGESDEECTA DVALRSLDHD FDDRWAELAV VTRDHDLWIK EDSRSDDLAD 
YSYWAGSEEY TTIVGAYGAD LPETVREFVA DRRVEKDARI DAAVDRAVTH DIGEWTVAVT 
YGRCSQNEVA EALREQGADG AVIVKPAGSA SIRGSEDFQH AHEVAGKVNG GGHPQAAGCK 
PDIYDDMLDY AQHWTTEGQA CKRVILAAFE AVAEEVAAAD ESDETETDE