Gene Hlac_0139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hlac_0139
Symbol
ID	7401660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorubrum lacusprofundi ATCC 49239
Kingdom	Archaea
Replicon accession	NC_012029
Strand	+
Start bp	147209
End bp	148336
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	68%
IMG OID	643707203
Product	pyruvate dehydrogenase (acetyl-transferring) E1 component, alpha subunit
Protein accession	YP_002564815
Protein GI	222478578
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID	[TIGR03181] pyruvate dehydrogenase E1 component, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTATGAAG AGGTGGGTTC GACCGTGAGC GTGTTCGACA GAGCGTACGA CGATCCGGTC 
CGCGTTCTCG ACGAGGGCGG CGAGGTCGTC GGCGACGTGC CGGACCTCGA CGACGAGGCG 
CTCGTCGAGA TGTACCGGGA CATGCGGCTG GCGCGGCACT TCGACGGTCG CGCCGTGAGC 
CTCCAGCGGC AGGGGCGGAT GGGGACGTAT CCGCCGCTGT CCGGACAGGA GGGCGCGCAG 
ATCGGCTCCG CGACCGCGCT CGACGAGGAC GACTGGATGG TCCCCTCGTA CCGCGAGCAC 
GGCGCGGCGC TCGTTCGTGG ACTCCCGCTG AAACAGACCC TACTCTACTG GATGGGCCAC 
GAGGCGGGCA ACGCGACGCC CGAGGGCGTG AACGTGTTCC CGGTCGCGGT CCCCATCGCC 
TCGCAGGTCC CGCACGCCAC CGGTGCGGCG TGGGCGTCGA AGCTCCGCGG CGAGAACGAC 
GCGTTCCTCT GTTACTTCGG GGACGGCGCG ACCAGCGAGG GCGACTTCCA CGAGGGGGTC 
AACTTCGCGG GCGTGTTCGA TACGCCGACC GTCTTCTTCT GTAACAACAA CCAATGGGCC 
ATCTCCGTGC CCCGCGAGCG ACAGACGCGG AGTGCGACGC TGGCCCAGAA GGCGGAGGCG 
TACGGGATCG ACGGGGTACA GGTCGACGGG ATGGACCCGT TGGCGGTGTA CAGCGTCACG 
AAGGCAGCCG TCGAGAAGGC GCGTGACCCC GAGACCGACC GACCTCGCCC GACGCTGATC 
GAGGCGATCC AGTATCGGTT CGGCGCGCAC ACGACCGCCG ACGATCCGAC GGTCTACCGC 
GACGACGACG AGGTCGAGAG CTGGAAACGG AAGGACCCGA TCCCGCGACT CGAACGCTAC 
CTCCGGTCCG AGGGCGTGCT CGACGACGAG CGCGTCGCGG AGATCGAGAC CGCCGTCGAG 
ACACGGGTGG CAGAGGCCAT CGAGGCGGCC GAGTCGGAGG TGCGGCCGAA GCCACAAGAG 
ATGTTCGAGC ACGCGTACGC GGAGCTCCCA CCCGAGCTAG AGCGGCAGTA CGAGGAGTTC 
GCGGCGTTCC GCGAGGCACA CGGCGACGAA GCATTCTTGG AGGAGTGA

Protein sequence

MYEEVGSTVS VFDRAYDDPV RVLDEGGEVV GDVPDLDDEA LVEMYRDMRL ARHFDGRAVS 
LQRQGRMGTY PPLSGQEGAQ IGSATALDED DWMVPSYREH GAALVRGLPL KQTLLYWMGH 
EAGNATPEGV NVFPVAVPIA SQVPHATGAA WASKLRGEND AFLCYFGDGA TSEGDFHEGV 
NFAGVFDTPT VFFCNNNQWA ISVPRERQTR SATLAQKAEA YGIDGVQVDG MDPLAVYSVT 
KAAVEKARDP ETDRPRPTLI EAIQYRFGAH TTADDPTVYR DDDEVESWKR KDPIPRLERY 
LRSEGVLDDE RVAEIETAVE TRVAEAIEAA ESEVRPKPQE MFEHAYAELP PELERQYEEF 
AAFREAHGDE AFLEE