Gene Hlac_0140 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0140
Symbol
ID	7401661
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	148337
End bp	149323
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	67%
IMG OID	643707204
Product	Transketolase central region
Protein accession	YP_002564816
Protein GI	222478579
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGA CACAGAACCT TACCGTGGTA CAGGCGGTTC GAGACGGATT GTACACCGAG 
ATGCGCGAGG ACGACGACGT CCTCGTGTTG GGCCAAGATG TGGGGAAGAA CGGCGGCGTC 
TTCCGCGCGA CCGAGGGCCT GTTCGACGAG TTCGGCGGCG ACCGCGTCGT CGACACCCCG 
CTTGCAGAGT CGGGGATCGT CGGTGCCGCC GTCGGCATGG CCGCGATGGG ACTCAAACCC 
GTTCCCGAGA TCCAGTTTTC GGGGTTCATG TATCCCGGTT TCGACCAGAT CGTCTCCCAC 
ATGGCCCGCT TCCGGACGCG AAGCCGGGGG CGATTCAACC TGCCGATGAC CCTCCGCGCC 
CCGTACGGTG GCGGAATTCG GGCGCCGGAG CACCACTCCG AGTCGAAGGA GGCGTTTTAC 
GCCCACGAGG CCGGGCTGAA GGTCGTCATC CCCTCGACCC CGTACGACGC GAAGGGGCTG 
CTCGCGGCGT CGATTCGCGA CCCCGACCCG GTGATCTTCC TCGAACCGAA GCTCATCTAC 
CGGGCGTTCC GCGGCGAGGT GCCCGAGGAG CCGTACACCG TTCCCATCGG TGAGGCGGTC 
ACCCGCCGTG AGGGCGGCGA CGTGGCGGTG TTCACCTACG GCGCCATGAC GCGCCCGACG 
CTCGAGGCCG CTGAGACCCT CGCCGAGGAG GGGATCGATT GCGAGGTCGT CGACCTCCGA 
ACCGTCTCAC CGCTCGACCG CGAGGCGATC ATCGAGGCGT TCGAGGCCAC CGGGCGTGCC 
GTCGTCGTCC ACGAAGCCCC GAAGACGGGG GGGCTCGCCG GCGAGATCAC GGCGATCATT 
CAGGAGGAGG CGCTCCTGTA TCAGGAGGCG CCCGTGAAGC GCGTCACCGG ATTCGACGTG 
CCGTACCCGC TGTACGCGCT GGAGGACTAC TACCTCCCGA CCGCGACCCG CATCGAGGAG 
GGTATCAGAG AGGCGGTGGA GTTCTGA

Protein sequence

MSETQNLTVV QAVRDGLYTE MREDDDVLVL GQDVGKNGGV FRATEGLFDE FGGDRVVDTP 
LAESGIVGAA VGMAAMGLKP VPEIQFSGFM YPGFDQIVSH MARFRTRSRG RFNLPMTLRA 
PYGGGIRAPE HHSESKEAFY AHEAGLKVVI PSTPYDAKGL LAASIRDPDP VIFLEPKLIY 
RAFRGEVPEE PYTVPIGEAV TRREGGDVAV FTYGAMTRPT LEAAETLAEE GIDCEVVDLR 
TVSPLDREAI IEAFEATGRA VVVHEAPKTG GLAGEITAII QEEALLYQEA PVKRVTGFDV 
PYPLYALEDY YLPTATRIEE GIREAVEF