Gene Hhal_1036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1036
Symbol
ID	4709772
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1116889
End bp	1118259
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	72%
IMG OID	639855507
Product	pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase
Protein accession	YP_001002614
Protein GI	121997827
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID	[TIGR01348] pyruvate dehydrogenase complex dihydrolipoamide acetyltransferase, long form

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCGGAAC AGGAGCTCAA GGTACCGGAT ATCGGCGGCT TCGAGGAGGT GGAGGTCATC 
GAGGTCCTGG TTGCGCCCGG CGACCGGATC GAGGCCGAGC AGTCGCTGAT CACACTGGAG 
TCCGACAAGG CGAGCATGGA GGTGCCGGCC GAGGTCGGGG GCGAGATCCG AGCGGTGCAT 
GTGGCCGTGG GGGATACCGT CTCCGAGGGG AGTGTCGTTG CCACCGTTGA TCCTGTCGCC 
GAGCCGGCGG AACCGGCGAC GCAGGCCGAG GCCCCGGCCG CCGCGGGTGG CCCGGCGGAG 
GAAACGGCCC CGTCGGCCGA TGGCGGCGCG CCAGCGACCG CGGCCCCCGC CGCCGCGGCG 
CAACCGGCTG CCTCCGCGGG CAGTGGCGGG GGCGCTGCAG CCGGAGGTGT CGACGAGTCG 
CCGGCGATCG ACCGCGACGG CCATCGCGCC GCCCACGCCA GCCCCTCGGT ACGCCGCTAC 
GCCCGCGAGC TCGGGGTCGA TCTCTCCCGC GTGCAGGGCA GCGGGCGTAA GGGGCGCATC 
CGCCGTGAGG ACGTGGAGGC CTACGTCAAG CAGGTGATGC AGGGCCAGGA GGCGCCGCCG 
GCTGGCGCCG CCGGTGCCCC CGCTGCCGAA GGGGCCGGCA TCCCGCCGAT CCCGGAGCAG 
GACTTCAGCC GCTTCGGCGA GGTGGAGCGC GTGCCGCTCA CCCGTATCCA GCGCCTCTCG 
GGGCCGCACC TGCACCGGAG CTGGCTGAAT GTCCCGCACG TGACCCAGTT CGACGAGGCC 
GATATCACCG AGATGGAGGC GTTCCGCCAA TCTCTCAAGA AGGAGGCCGA GGCGCGGGGG 
GTGAAGCTGA CCCCGCTGGC CTTCCTGGTC CGGGCGGCGG CCGCCGCCCT GGCGGAGTAT 
CCGCGTTTTA ACGCCAGCCT TTCGGCGGAC GGGCAGGAGC TGATCCTCAA GCACTACTGC 
CACATCGGCG TCGCCGTCGA CACCCCGGAG GGGCTGGTGG TGCCGGTGCT GCGTGACGCC 
GACCAGAAAG GCGTCCTGCA GATCGCCGAG GACCTCGGCA CCCTCTCGGC CAAGGCCCGG 
GACGGCAAGC TCGGTCCGGC GGACATGCAG GGCGGCTGCT TCTCCATCTC GAGCCTCGGT 
GGTATCGGCG GTACCGCGTT CACGCCCATT GTCAACGCTC CGGAAGTGGC CATCCTCGGT 
GTCTCCCGGT CGCAGACCCG GCCGGTGTGG GATGGGCAGA CCTTCCAGCC GCGGCTGATG 
CTCCCGCTGT CGCTCTCCTA CGACCACCGG GTCATCGATG GCGCCATGGC TGCCCGCTTC 
ACCAACTACC TGAGCCAGGT CCTCGGCGAC CTGCGCCGGC TGGTGTTGTA G

Protein sequence

MAEQELKVPD IGGFEEVEVI EVLVAPGDRI EAEQSLITLE SDKASMEVPA EVGGEIRAVH 
VAVGDTVSEG SVVATVDPVA EPAEPATQAE APAAAGGPAE ETAPSADGGA PATAAPAAAA 
QPAASAGSGG GAAAGGVDES PAIDRDGHRA AHASPSVRRY ARELGVDLSR VQGSGRKGRI 
RREDVEAYVK QVMQGQEAPP AGAAGAPAAE GAGIPPIPEQ DFSRFGEVER VPLTRIQRLS 
GPHLHRSWLN VPHVTQFDEA DITEMEAFRQ SLKKEAEARG VKLTPLAFLV RAAAAALAEY 
PRFNASLSAD GQELILKHYC HIGVAVDTPE GLVVPVLRDA DQKGVLQIAE DLGTLSAKAR 
DGKLGPADMQ GGCFSISSLG GIGGTAFTPI VNAPEVAILG VSRSQTRPVW DGQTFQPRLM 
LPLSLSYDHR VIDGAMAARF TNYLSQVLGD LRRLVL