Gene Hlac_0729 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0729
Symbol
ID	7400202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	743444
End bp	744505
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	63%
IMG OID	643707795
Product	amidohydrolase 2
Protein accession	YP_002565401
Protein GI	222479164
COG category	[R] General function prediction only
COG ID	[COG2159] Predicted metal-dependent hydrolase of the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.455369
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGAGA AGGACGGCGA GGAGATCTTC GTCATCGACG GCCACGTCCA CCTGTGGGAC 
GCGCGGCAGG AGAACATCAT TCACGAGGGG GGCGAGCAGT TCCTCCAGTG TTTCTACGAT 
TACCATACCG GGTTCACCCC GGAGGAGGAA CAGTGGGACA TCGACGAGTA CCGCCACTAC 
GGCGCCGACC GCATGACCGA GGACCTGTTC GGGAACGCGG CCGCCGACAT GGCAATCTTC 
CAGCCGACGT ACCTCTCCGA CTTCTACGAC GAGGGGTTCA ACACGACCGA ACAGAACGCC 
GAACTCGCGG AGGAGTACCC CGAGCGGTTC GTGCTCAACG GGAGCTTCGA CCCGCGTGAC 
GGCGAAGAGG GGCTGCGCTA CCTCGAACAC CTCAAAGAGG AGTACGACAT CCCCGGCGTG 
AAGCTGTACA CCGCTGAGTG GCGCGACGAC TCGAAGGGGT GGCGGCTCGA CAGCGACGAC 
GCCTTCAAGT TCCTCGAGAA GTGTTCGGAG CTCGGCATCG AGAACATCAA CGCCCACAAG 
GGACCGACGA TCCGCCCGCT CAACCGCGAC GCGTTCGACG TGAAGGACAT CGACGACGCC 
GCCTCGTCGT TCCCGGAGCT CAACTTCATC GTCAACCACG TCGGGCTCCC GCGGCTCGAC 
GACTTCTGTT GGATCGCCGC CCAAGAGCCG AACGTGTACG GCGGGCTCGC GGTCGCCTCC 
GCGATGTCGA CTCACCGCGA GCGGAAATTC GGCGAGATCA TGGGTGAGCT CCTCTTCTGG 
CTCGGCGAAG ACCGGGTCCT GTTCGGCTCC GACTACGCGC TGTGGAACCC CGACTGGCTC 
GTCGAACAGG TGATAAACGC GGAACTCACC GACGAGCAGA AAGACGAGTA CGGCGTCGAG 
CTCGACGTCG ATACGATGAA GAAGATCATG GGCGAGAACG CCGCGGAGCT GTACGACATC 
GATATCGAGG AGAAAAAGCG GCAGTTCCGC GACGACGACA TCACGGAACG GTTCGACCTC 
GAGTCCCACT ACGGCGGCGA TGCGGGGGCC AGGGCGGACT GA

Protein sequence

MYEKDGEEIF VIDGHVHLWD ARQENIIHEG GEQFLQCFYD YHTGFTPEEE QWDIDEYRHY 
GADRMTEDLF GNAAADMAIF QPTYLSDFYD EGFNTTEQNA ELAEEYPERF VLNGSFDPRD 
GEEGLRYLEH LKEEYDIPGV KLYTAEWRDD SKGWRLDSDD AFKFLEKCSE LGIENINAHK 
GPTIRPLNRD AFDVKDIDDA ASSFPELNFI VNHVGLPRLD DFCWIAAQEP NVYGGLAVAS 
AMSTHRERKF GEIMGELLFW LGEDRVLFGS DYALWNPDWL VEQVINAELT DEQKDEYGVE 
LDVDTMKKIM GENAAELYDI DIEEKKRQFR DDDITERFDL ESHYGGDAGA RAD