Gene Hmuk_2053 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2053
Symbol
ID	8411588
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	1962652
End bp	1963701
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	70%
IMG OID	645020391
Product	Threonine aldolase
Protein accession	YP_003177873
Protein GI	257388100
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2008] Threonine aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGGAC ACGACGACCC GATCGACCTC CGATCAGACA CGGTGACTAG GCCCTCGACA 
GCCATGCGGG AGGCCGCCCG CAACGCCCCA GTCGGCGACG ACGTGTACGG CGAAGATCCC 
ACCGTCGCCG AACTGGAGGC CCGTGCCGCC GGTCTGCTCG GGAAAGCCGA CGCGCTCTTC 
GTTCCCAGCG GCACCATGGG CAACCAGATC GCCGTCCGGG CCCACACCGA ACGGGGACAG 
GAACTCCTGC TGGATCGTGA GTCACACATC TATCGCTGGG AACTCGGCGG GACCGCCCAG 
CACGCACAGG TCCAGTGTCG CACGGTCGAC GCCAGCGAGC GCTGCGTACC GACCCCCGAA 
CAGATCAGCG AGGCGTTCGT CGCCGAGGAC CTGCACCGAC CGGGGACCGG TCTGGTGACC 
CTGGAGAACA CGCACAACTA CCGCGGCGGC GTCGCGGTCC CCGAATCCCA CGTCGACGCC 
GCGTGTGACG CGGCACACGC TCTCGGCGTG CCGGTCCACC TCGACGGCGC GCGGCTGTGG 
AACGCCGCGG TCGCGCTCGA CACCGCGCCG GCCGCGCTCG CCCGAGAAGC GGACTCGGTG 
ATGGCCTGCC TCTCCAAGGG ACTGGGCGCA CCCGTCGGCT CGGTCCTCGC GGGCACCGAG 
TCGTTCGTCG ACGAGGCCCG TCGCCTCCGG AAGCTGTTTG GCGGCGGAAT GCGCCAGGCG 
GGCATGATCG CGGCACCCGG CCTCGAAGCG CTCGACAACG TCGACCGGCT CGCCGACGAC 
CACGAGAACG CACGGCGGCT GGCGACCGGT CTCGACGCGA TAGACGGCCT CCGCGTGCCG 
ACACCGGAGA CCAACATCGT CGTCGTCGAC AGCGAACCCG CCGGGATCAC CAGCGACGCC 
TTCGTCGAGG GCTGTGTGGC GCGTGGCGTT CGCTGTGGGA GCGTCTCCGA GTACACGACG 
CGGCTGTGTA CCAACCTCGA CGTGGACCGC GCCGACGTCG ACGCGGCGAT CGATCGGATC 
GGGCGCGTGG TCCGAGCGGC CACCGAATAG

Protein sequence

MSGHDDPIDL RSDTVTRPST AMREAARNAP VGDDVYGEDP TVAELEARAA GLLGKADALF 
VPSGTMGNQI AVRAHTERGQ ELLLDRESHI YRWELGGTAQ HAQVQCRTVD ASERCVPTPE 
QISEAFVAED LHRPGTGLVT LENTHNYRGG VAVPESHVDA ACDAAHALGV PVHLDGARLW 
NAAVALDTAP AALAREADSV MACLSKGLGA PVGSVLAGTE SFVDEARRLR KLFGGGMRQA 
GMIAAPGLEA LDNVDRLADD HENARRLATG LDAIDGLRVP TPETNIVVVD SEPAGITSDA 
FVEGCVARGV RCGSVSEYTT RLCTNLDVDR ADVDAAIDRI GRVVRAATE