Gene Hlac_0061 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0061
Symbol
ID	7401416
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	64231
End bp	65565
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	72%
IMG OID	643707122
Product	amidohydrolase
Protein accession	YP_002564737
Protein GI	222478500
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0182363
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACGC TTCGCGTGAC GGGCGGACGG GTGCTCCGTC CCGACGGCCG CGTGACCGAG 
TCGGACGTGA CGATCGACCG CGACGCCGGA ACGATCGTCG CGGTGGGCGA CGAGACGGTG 
AGCGACGCCG AAGCGGGAAG CGACGCCGAA GTCGCGAGCG ACGGGGAGAC CCTCGACGCG 
TCCGGCTCGC TCGTGATCCC CGGACTCGTC AACGCGCACA CGCACGTCGC GATGACGCTC 
CTTCGGGGAT ACGCCGACGA CAAGCCGCTC GACCCGTGGC TACGGGAGGA CATCTGGCCG 
GCCGAGGCCG AACTCACGCC GGACGACATC GAGGCGGGCG CCGAACTCGG CGTCGTCGAG 
ATGATCCGGT CGGGGACGAC CGCGTTCGCG GACATGTACT TCGCGATGGA CCGCGTCGCG 
GACGTGGTCG ATCGCGCGGG GCTGCGGGCG CGCCTTGGCC ACGGGGTCGT CACGATCGGG 
AAGGACGCCG AGGGCGCTCG CGCCGACGTC GAGGAGAGTC TCGCGGTCGC TCGCGAACTC 
GACGGCGCCG GAGACGGGCG GATCCGGACC GCCTTCATGC CGCACTCGCT GACGACGGTG 
GGCGAGGAGT ACCTCCACGA GGGCGTCGCG GAGGCGCGCG AGGCGGGCGT CCCGATTCAC 
CTCCACGCGA ACGAGACGGA AGACGAGGTC GACCCGATCG TCGACGAGCG CGGGGAGCGT 
CCGATCGCGT ACGCGCAGGA TCTCGACGCG CTCGGCCCGG ACGACTTCTT CGCGCACGGC 
GTCCACCTCG ACGGCTCGGA GATCGACCAG ATCGCCGACG CGGGCACCGC GATCGTCCAC 
TGTCCGGCCT CGAACATGAA GCTCGCAAGC GGGATGGCCC CGGTCCAGCG GCTCCGCGAC 
GCGGGCGTCA CGGTCGCGCT CGGCACCGAT GGGGCGGCCT CGAACAACGA CCTCGATGTG 
TTCGACGAGA TGCGCGACGC CGCCATGCTC GGGAAGCTCG CTGCGGACGA CGCCACCGCG 
GTGCCCGCCG AGGCGGTCGT GGAGATGGCG ACGGCCGGCG GTGCAGACGC TCTCGGCCTC 
CCCGGCGGTC GGATCGAGCC GGGCGCGGCC GCCGACCTCG CCGTCGTTGA CCTCGACGCC 
CCGCACCTGA CGCCAGTCCA CGACCCCGTC TCCCACCTCG CGTACGCGGC GCACGGGAGC 
GACGTGCGCC ACACCGTCTG CGACGGCGAG GTGTTGATGC GCGACCGCGA GGTCCTGACG 
CTCGACGCTG AGCGCGTACA GGAGCGGGCG GCGACGGCCG CGAGCGACCT CGTCGATCGA 
GTCAGCGAAT CGTAA

Protein sequence

MNTLRVTGGR VLRPDGRVTE SDVTIDRDAG TIVAVGDETV SDAEAGSDAE VASDGETLDA 
SGSLVIPGLV NAHTHVAMTL LRGYADDKPL DPWLREDIWP AEAELTPDDI EAGAELGVVE 
MIRSGTTAFA DMYFAMDRVA DVVDRAGLRA RLGHGVVTIG KDAEGARADV EESLAVAREL 
DGAGDGRIRT AFMPHSLTTV GEEYLHEGVA EAREAGVPIH LHANETEDEV DPIVDERGER 
PIAYAQDLDA LGPDDFFAHG VHLDGSEIDQ IADAGTAIVH CPASNMKLAS GMAPVQRLRD 
AGVTVALGTD GAASNNDLDV FDEMRDAAML GKLAADDATA VPAEAVVEMA TAGGADALGL 
PGGRIEPGAA ADLAVVDLDA PHLTPVHDPV SHLAYAAHGS DVRHTVCDGE VLMRDREVLT 
LDAERVQERA ATAASDLVDR VSES