Gene Hlac_2646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_2646
Symbol
ID	7400851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	2630278
End bp	2631453
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	72%
IMG OID	643709718
Product	amidohydrolase
Protein accession	YP_002567287
Protein GI	222481050
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1228] Imidazolonepropionase and related amidohydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACGTGA TTCGAGGCGG ACAAGTGGCT GACGTCGACG GGACTCGCGA GGCCGATGTC 
GCGGTCGCAG ACGGCGAGAT CGTCGCGGTC GGGCCGGACG CGGTCGACGA GATCGGCGGT 
GAGGACGCGG TCGACGCCGA GACCGACGCG AGCGGCTCGG TGGTCGCATC GGGGCTGATC 
GACGCGCACG TCCACGTCAT GATGGACGGG CGACCAGATG TCGCCACCGC GGTCTCCGAC 
AGCGACTACA CCGCGAGCTA CCGGACCGCC GGCAACCTCC GAGACGCCCT CGAAGCGGGG 
GTCACGACGG TCCGCGATCT GGGGGGCCGC GGGACGCTCG CGCTCGACGC GGGCGAGGCG 
GTCGCCGCCG GCGACATCGA CGGTCCGCGC GTCCTCGCCT GCGGCCGCAA CGTGATCATG 
ACCGGCGGCC ACGGCAACTG GTTCGGCCGC GAGGCCGACG GTCCGGCCGA GGTCCGAAAG 
GCGGCCCGCG AGCAGCTGAA GGCGGGCGCG GACGTGCTCA AGTGCATGGC GACGGGCGGC 
GTCCTTACCG AGGGCGCGGT GACCGGCGCC CCGGAGCTGA CTCCCGAAGA ACTCGCGGCG 
TTCACCGATG CCGCCGCTCC GACGAACACT CCTACCGCGG CTCACGCCCA CGGCGAGACA 
GGGATCAAGA ACGCGGTCGA GGCCGGGATT TCGAGTATCG AGCACGGCAC CTTCATGGAC 
CGCGAGGCCG CCGAGATGAT GGCCGATCGA GGGACCTATT GGGTGCCGAC CGCGAGTGCG 
CTCCGCGGAA TCGTTGATCA CGGCGTCGAG TCCGGGATCC CGGAGGACGC CGTCGAAAAG 
GCCGAAGACG CCGCCGACCG CTTCGACGAC GCGTGGGGCC ACGCGCTGGA GGCCGACGTG 
CCGATCGCAA TGGGCACGGA CGCCGGCACC CCGTTCAACT TCTTCGGGGA CATCCCGCGG 
GAGCTTGCGT ACATGGTCGA GCACGGACTC TCGCCGGAGC GGGCGCTCGA GGCCGCCACC 
GTCAACGCCG CGGATCTGCT CGGGCTCGAC GACGTGGGCC GAATCGGGGA GGGGTACCGC 
GCCGACCTCG TCGTCCTCGA GGCCGACCCC ACCGAGGACG TGGCGGCGTG GCAGGAGCCG 
GAGGCAGTGT TCGCCGCCGG CGAGCGGGTC GCGTAA

Protein sequence

MHVIRGGQVA DVDGTREADV AVADGEIVAV GPDAVDEIGG EDAVDAETDA SGSVVASGLI 
DAHVHVMMDG RPDVATAVSD SDYTASYRTA GNLRDALEAG VTTVRDLGGR GTLALDAGEA 
VAAGDIDGPR VLACGRNVIM TGGHGNWFGR EADGPAEVRK AAREQLKAGA DVLKCMATGG 
VLTEGAVTGA PELTPEELAA FTDAAAPTNT PTAAHAHGET GIKNAVEAGI SSIEHGTFMD 
REAAEMMADR GTYWVPTASA LRGIVDHGVE SGIPEDAVEK AEDAADRFDD AWGHALEADV 
PIAMGTDAGT PFNFFGDIPR ELAYMVEHGL SPERALEAAT VNAADLLGLD DVGRIGEGYR 
ADLVVLEADP TEDVAAWQEP EAVFAAGERV A