Gene Hlac_0872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0872
Symbol
ID	7401242
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	-
Start bp	860477
End bp	861898
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	68%
IMG OID	643707937
Product	isopropylmalate isomerase large subunit
Protein accession	YP_002565540
Protein GI	222479303
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGG GGACCCTGTA CGACAAGGTG TGGGACCGGC ACACGGTGAC GAAGCTGCCC 
ACCGGACAGG ACCAGCTGTT CGTCGGGCTC CACCTCGTTC ACGAGGTCAC CAGCCCGCAG 
GCGTTCGGCA TGCTGAAAGA GCGCGACCAA GAGGTGGCGT TCCCGGAGCG CACGCACGCG 
ACCGTCGACC ACATTGTGCC GACTGGGAAC CGCGATCGGC CCTACCGCGA CGAGGCCGCC 
GAGAACATGA TGGCGGAGCT GGAGGCGAAC GTCCGCGGCT CGGGCATCGA CTTTTCCGAT 
CCGGACTCCG GCAACCAGGG GATCGTCCAC GTTATCGGGC CGGAGCAGGG GCTCACCCAG 
CCGGGAATGA CGATCGTCTG TGGCGACTCG CACACGTCGA CGCACGGCGC GTTCGGCGCG 
CTGGCGTTCG GCATCGGCAC CTCGCAGATC CGCGACGTGC TCGCGACGGG CTGTATCGCC 
ATGGAGAAAC AGCAGGTCCG CAAGATCGAG GTCACGGGCG AGCTCGGCGA GGGCGTCACC 
GCGAAGGACG TCATCCTGAC GATCATCGGG AAGCTCGGGA CCGACGGCGG CGTCGGCTAC 
GTCTACGAGT ACGCCGGCGA GGCCATCGAG GACCTCGGGA TGGAAGGGCG GATGTCCATC 
TGTAACATGT CGATCGAAGG CGGCGCCCGC GCGGGATACG TCAACCCCGA CGAGACCACC 
TACGAGTGGC TCGCGGAGAC GGACGCCTTC GCCGACGACC CCGAGAAGTT CGAGCGGCTG 
AAACCCTACT GGGAGTCGAT CCGGAGCGAC GCCGACGCCG AGTACGACGA CGTGGTCACC 
ATCGACGGCT CGGCGATCGA ACCGACCGTC ACGTGGGGGA CCACGCCCGG TCAGACCGCG 
GGCATCACCG AGCCGATCCC GGATCCCGAC GACCTGCCCG AGGAGGACCG CGACACCGCG 
AAGCGGGCAC AGAAACACAT GCGCGTCGAG CCCGGCGACA CGATGGAGGG GTACGACATC 
GACGTGGCGT TCCTCGGCTC GTGTACTAAC GCGCGGCTGA AGGACCTCCG CGAGGCCGCG 
GCGTTCGTCG AGGGTCGCGA GGTCGACGAC GACGTGCGCG CGATGGTCGT CCCCGGTAGC 
CAGCGCGTCC GCGACGCCGC CGAGGCCGAA GGGATAGACG AGATATTCAT CGAGGCCGGC 
TTCGACTGGC GCGAGCCCGG CTGTTCGATG TGTCTCGGCA TGAACGACGA CCAGCTGGTG 
GGCGACGAGG CGAGCGCCTC CTCGTCGAAC CGGAACTTCG TCGGCCGACA GGGCTCGAAG 
GACGGGCGCA CCGTGCTGAT GAGTCCGATC ATGGTCGCGG CCGCGGCGGT GACCGGCGAG 
GTCACCGACG TCCGCGAGAT GGAGGAGGTG GCGACCGTAT GA

Protein sequence

MSEGTLYDKV WDRHTVTKLP TGQDQLFVGL HLVHEVTSPQ AFGMLKERDQ EVAFPERTHA 
TVDHIVPTGN RDRPYRDEAA ENMMAELEAN VRGSGIDFSD PDSGNQGIVH VIGPEQGLTQ 
PGMTIVCGDS HTSTHGAFGA LAFGIGTSQI RDVLATGCIA MEKQQVRKIE VTGELGEGVT 
AKDVILTIIG KLGTDGGVGY VYEYAGEAIE DLGMEGRMSI CNMSIEGGAR AGYVNPDETT 
YEWLAETDAF ADDPEKFERL KPYWESIRSD ADAEYDDVVT IDGSAIEPTV TWGTTPGQTA 
GITEPIPDPD DLPEEDRDTA KRAQKHMRVE PGDTMEGYDI DVAFLGSCTN ARLKDLREAA 
AFVEGREVDD DVRAMVVPGS QRVRDAAEAE GIDEIFIEAG FDWREPGCSM CLGMNDDQLV 
GDEASASSSN RNFVGRQGSK DGRTVLMSPI MVAAAAVTGE VTDVREMEEV ATV