Gene Hlac_1569 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_1569
Symbol
ID	7401502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	1587293
End bp	1588537
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	70%
IMG OID	643708636
Product	metal dependent phosphohydrolase
Protein accession	YP_002566226
Protein GI	222479989
COG category	[R] General function prediction only
COG ID	[COG1078] HD superfamily phosphohydrolases
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACGG TCAAGGACAC CGTCCACGAC CACATCGAGA TCGACGGTGT CGCGGCGGAC 
CTCCTCGACA CCCCCGCAGT CCAGCGGCTC AGACACGTCA AACAGCTCGG CACGGTCCAG 
CTCGTCTACC CCTCCGCGAA CCACACCCGC TTCGAGCACT CGCTCGGCGT CTACCACCTC 
GCCAGCCGCG CGCTCGGCCA CCTCGGGATT GGGGGAAAGC GCGCAGACCG GATCGAAGCC 
GCGGCCATGC TCCACGACGT GGGTCACGGC CCGTTCAGCC ACAATCTGGA GTCGCTCACC 
CACCGCCGCA CGGGGAAGTA CCACGACGAC GTCGACGAGG TGCTCGCGAC CGGCGCGGTC 
GGCGAGGTGC TCCGCGATCA CGACCTCGAC CCGGAGAAGA TCGCCGGGCT CGTCGCCGGC 
GAGGGACCGT ACGGCGGGCT CGTCTCGGGC GAGCTCGACG TTGATCGCAT GGACTACCTC 
GTGCGCGACG CCTACCACAC CGGGGTGCCG TACGGCACCA TCGACACCGA GCGGTTCGTC 
CGGGAGCTGA CGTTCGTCGA CGTGGGCACC GGCACCAACG AACTCGTCTT GGACGAGGGG 
AACGTCCAGA CGGCCGAGAG CCTCCTTCTG GCGCGCGCAC TGATGAACCC GGTCGTGTAC 
ACCCACCACG TCGCGCGCAT TTCGAAGGCA ATGCTTCGGC GGGCGGCGAG CGACTTACTC 
GACGCGACCA CGACGACCCC GGCCCAGCTT CGCCGGATGG ACGACCACGA CTTCCTCGCG 
GCGATCCGAA GCTGCTCGGA GACCGCCGAG CTCTCCCGGC GGTACGACGA GCGCGACCTG 
TACAAGCGGG CGGTGTGGGC CGAGTACGAC GACGTGGCCG AGCGTGTCCA TGAGGCCGAC 
CACGACACTG AGAGTGCGCT GGAACGCGAG ATCGCCGAGG AGGCGGGCGT CGCCCGTCAG 
CACGTGATCC TCGATGTCCC CCCGGAGCCG TCGATGCGGG AGTCGACAGC GCGGGTCACC 
GTCAACGGCG AGGTGCGTCG GTTAGAGCGG CAGTCACCCC TCGTCTCCAC GCTCCGGACC 
GCCCAGCGCA ACCAGTGGCG CCTCGGTGTC TACGCCCCTC ACCCCGCGAC CGATCGCGTC 
GGCCGCGCCG CCGCCGACGT GCTCGGACTC GACCCCGACG GGCTCGTCGC GGAGGTGCGC 
GGCGCGATGC CGACGACGCT CGACGAGTTC CGAGACGGGG CGTGA

Protein sequence

MITVKDTVHD HIEIDGVAAD LLDTPAVQRL RHVKQLGTVQ LVYPSANHTR FEHSLGVYHL 
ASRALGHLGI GGKRADRIEA AAMLHDVGHG PFSHNLESLT HRRTGKYHDD VDEVLATGAV 
GEVLRDHDLD PEKIAGLVAG EGPYGGLVSG ELDVDRMDYL VRDAYHTGVP YGTIDTERFV 
RELTFVDVGT GTNELVLDEG NVQTAESLLL ARALMNPVVY THHVARISKA MLRRAASDLL 
DATTTTPAQL RRMDDHDFLA AIRSCSETAE LSRRYDERDL YKRAVWAEYD DVAERVHEAD 
HDTESALERE IAEEAGVARQ HVILDVPPEP SMRESTARVT VNGEVRRLER QSPLVSTLRT 
AQRNQWRLGV YAPHPATDRV GRAAADVLGL DPDGLVAEVR GAMPTTLDEF RDGA