Gene Pars_1189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1189
Symbol
ID	5055825
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1076790
End bp	1077902
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	59%
IMG OID	640468737
Product	pyruvate dehydrogenase (acetyl-transferring)
Protein accession	YP_001153410
Protein GI	145591408
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.605402
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.0471235
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGGAAA TAGATTTTAA TCAAAATTAT AAGATATCAG TAAAGGAGCC CCAAGTCCTA 
AGGGTCATAG AGCCTGACGG AACGTTGAGA GAGGAGGCAG AGCTCGGGTA CAAGCCGTCC 
GAGGGGGAGC TGGTTAAATT ATACCGCTAC ATGGTAACCG CCCGGGTTCT CGACAGGCAC 
GCCTTGCTTC TGCACAGGAT GGGCAAGGTT AAGTCCACTT ATGGTCCTCA CGAGGGTCAT 
GAAGCCGCCG ATGCCGGCAC TGTCCACGTA TTGAAGCCGG AGGACTGGAT TGCCCCGTAT 
TACCGGATGC TCACGGCTCT CTTGATCCGC GGCGTGCCGT TGCAGACCAT CTGGGCTAAG 
TTCTTTGCGA AGCAAGGGGA TCCTGACAAG GGGAGGAACT TGACGGTTGA GTGGGGCGGC 
TTCGCCAAGT GGCGCATTTT GTCCGTCGGC GCCCCGATCG GCCACCAGTA CATCTACGCG 
GCCGGCTTCG CCTACGCTCT TAGGTACATG AAGAGGGATG AGATAGTGGC GGCCTATATA 
GGCGATGGCG GCACCTCCAC TAACGGCTTC CACACGGGCC TCAACTTTGC CGGCGTCTTC 
AAACTACCCG TCGTGTTCTA CGTCTACAAC AACCAATACG CCATATCGGT GCCCGTGCGC 
AGCCAGACTG CCGTGACGAG GCTGGCCATC AAGGCCGCCG CATACGGCAT AGAGGGGATC 
GCTACCGACG GCATGGATCT CCTCGCGGTG CTCAAGGCGG CTCACTACGC GGTATCCAAG 
GCGAGGAGGG GCGAGCCGGT GCTGGTGGAG CTGATCACGT ATCGCTTTGG CCCCCACACA 
ACCGCCGACG ACCCGGCGAC GCGCTATAGG GATCCAGCCG AGGCCGAGGA ATGGAGGCGC 
TACGACCCCA TAGCGAGGCT CGGGGCTTAC TTCAAGAAAT ACGGCATCTT GACCGAGAGG 
GAGATAAAGC TGACGTGGGA GGAGGCGGAG GCAGAGGTCA AGGTGGCGGC CAAGGAGGCC 
GAGTCGTACC CCGAAATACC GAAGGAGTGG ATCGTCGAGG ATGTATACAG CTTTATCCCG 
CCACACTTGA GGGAGGAGCT GGAGGAGCTA TGA

Protein sequence

MLEIDFNQNY KISVKEPQVL RVIEPDGTLR EEAELGYKPS EGELVKLYRY MVTARVLDRH 
ALLLHRMGKV KSTYGPHEGH EAADAGTVHV LKPEDWIAPY YRMLTALLIR GVPLQTIWAK 
FFAKQGDPDK GRNLTVEWGG FAKWRILSVG APIGHQYIYA AGFAYALRYM KRDEIVAAYI 
GDGGTSTNGF HTGLNFAGVF KLPVVFYVYN NQYAISVPVR SQTAVTRLAI KAAAYGIEGI 
ATDGMDLLAV LKAAHYAVSK ARRGEPVLVE LITYRFGPHT TADDPATRYR DPAEAEEWRR 
YDPIARLGAY FKKYGILTER EIKLTWEEAE AEVKVAAKEA ESYPEIPKEW IVEDVYSFIP 
PHLREELEEL