Gene Hlac_0289 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0289
Symbol
ID	7401215
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	311947
End bp	313275
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	70%
IMG OID	643707352
Product	threonine dehydratase
Protein accession	YP_002564964
Protein GI	222478727
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01127] threonine dehydratase, medium form

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.122969
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAACCGA TCCGACTCCG TTCCGCAACC GAGTCCTTTT CTGGGATCCC CGAGAACACC 
GCGCTCATGT CCTCCGTCAC GATCGCGGAC GTCGAGGCCG CCGCGGCCCG GCTCGAACCG 
GCGGCGATCG TCCAGCGCAC GCCCGTCGAG CGCAGCCGGT CGCTGAGCGA GCGGTGCGGC 
GCCGACGTGC GCCTGAAGAT GGAACACCTC CAGCGCACCG GCTCGTTTAA AACGCGCGGT 
GCGTATAACG CGATCTCGCG GGCAGTTGAG CAGGCGGCGG AACGAGCCGA TGAGTCCGAG 
CTCGACCGGG TCGTGGCCGC GAGCGCGGGC AACCACGCGC AGGGGGTCGC CCTGGCGGCG 
TCGGGCACCG GGATCGACGC GACGATCGTG ATGCCGGAGT CGGCGCCGGC AGCGAAGATC 
GAGGCGACCC GCGGGTACGG CGCCGAGGTC GTGCTCCGCG GGAGCGCGTT CCCGGAGGCG 
ATGGCGCACG CGCAGACGCT GATCGACGAC CCCGGAACGC GGTTCGTCCA CGCGTTCGAC 
GATCCGGACG TGGTCGCCGG GCAGGGAACG CTCGGGCTGG AGGTGCTCGA CCAAGTGCCA 
GACGTGGACA CCGTGCTCGT CCCGGTCGGG GGCGGCGGGC TGGCAGGCGG GGTCGCGACC 
GCGATCAAAG CGCGCTCGCC CGAGACGCGG GTGATCGGGG TCCAGACCGA GGGCGCCTCG 
ACGCTCTCGG AGAGCCTCGC GGCCGGCGAA CTCGTGACGC GCGAGGAGCC GGACACCATC 
GCGGACGGGA TCGCGACCGG CGGGCTGAGC GAGCTCACCT TCGGCCTGTT GAAAGAGCAC 
CTCGACGACG TGGTCGTCGT GAGCGACGAC GACGTGGCCG CCGCGATTCT GCTCCTCTTG 
GAGCGCGCGA AACAGATGAT CGAGGGCGCG GGCGCGACCG CGGCGGCCAC CCTTTTAAAT 
GACGACGCTC TCGACGAGCT CGATCTGGCC GGCGAGACGG TGGTGCCGCT GCTCTGTGGC 
GGCAACATCG ACGTCACGAC GCTGAAGGAG GTGGTGACGC ACGCCCTCGT GGAACGTGAC 
CAACTGATCG AACTTGCCGT CCGGATCGAC GACACGCCCG GGACGATGGG CGAGATATCC 
ACCCTGATCG GCGCGGAGCG CGCGAACATC CGGACGGTGC GCCACGAGCG CAGCCGGCCG 
GACCTGCCGG TCGGCGACGC CGACCTCGTG TTCGAGGTGG AGACCAACGG GCCGGCCCAC 
GTCGATCGGG TCCTGAAGGC GGTGCGCGAG GCGGGCTACG AGGTGGAGTG GACGACGCAG 
GAAGGGTGA

Protein sequence

MKPIRLRSAT ESFSGIPENT ALMSSVTIAD VEAAAARLEP AAIVQRTPVE RSRSLSERCG 
ADVRLKMEHL QRTGSFKTRG AYNAISRAVE QAAERADESE LDRVVAASAG NHAQGVALAA 
SGTGIDATIV MPESAPAAKI EATRGYGAEV VLRGSAFPEA MAHAQTLIDD PGTRFVHAFD 
DPDVVAGQGT LGLEVLDQVP DVDTVLVPVG GGGLAGGVAT AIKARSPETR VIGVQTEGAS 
TLSESLAAGE LVTREEPDTI ADGIATGGLS ELTFGLLKEH LDDVVVVSDD DVAAAILLLL 
ERAKQMIEGA GATAAATLLN DDALDELDLA GETVVPLLCG GNIDVTTLKE VVTHALVERD 
QLIELAVRID DTPGTMGEIS TLIGAERANI RTVRHERSRP DLPVGDADLV FEVETNGPAH 
VDRVLKAVRE AGYEVEWTTQ EG