Gene Pars_1188 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_1188
Symbol
ID	5055470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	-
Start bp	1075825
End bp	1076793
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	64%
IMG OID	640468736
Product	transketolase, central region
Protein accession	YP_001153409
Protein GI	145591407
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.489911
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.0419885
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAGCCA ACATGGCCAA GGCTCTGAAC ATGGCTCTTC GCGAGGAGAT GGAAAGGGAT 
CCCCGGGTGG TGATCCTCGG CGAGGACGTG GGGAAGAAGG GCGGCGTCTT CCTAATAACC 
GAGGGGCTCT ACGAGAAGTT CGGCCCCGAG CGCGTCATAG ACACGCCGCT CAACGAGGGC 
GGCATCATCG GCTTCGCCCT GGGGATGGCC CTAGCGGGTC TCAAGCCCGT GGCGGAGATC 
CAGTTCGCAG ATTTCTTCTG GCTAGGAGCC GACGAGCTGT TAAACCACGT GGCTAAGATC 
AGGTACCGCT CCGGCGGCAA CTTCAAGGCG CCTTTAGTGG TCAGGATGCC CTACGGCGCC 
GGCGTCAAGT CGGGCCTTTA CCACAGCCAA AGCCCCGAGG CCTACCTAGT GCACACACCC 
GGCCTCGTGG TGGTGGCGCC CTCCACGCCC TACAACGCCA AGGGCCTCCT CAAGGCCGCC 
ATAAGGAGCG ACGACCCGGT CGTGTTCCTG GAGCCCAAGG CCCTCTACAG AGCGCCGAGG 
GAGGAGGTCC CCGAGGAGGA CTACGTGGTG CCGCTGGGGA AGGCGAGGAT AGCGAGGGAG 
GGAGACGACG TAACCTTGGT CACATACGGC GCCATGTTGC CAAGATGTCT GGAGGCCGCC 
GAGAAGGCCA AGGCGTCTGT GGAGGTGGTG GACCTCCAGA CCCTCAACCC CATGGACTAC 
GAGACGGTGA TCAAGAGCGT GTCGAAGACC GGCAGGCTTG TGGTGGTCCA CGACGCCCCG 
AAGACCGGCG GCCTCGGCGC CGAGGTGGCG GCCATCGTCG CCGAGAAGGC CCTCCACGCG 
CTGACGGCGC CCGTGGTTCG CGTGGCCGGC CCAGACGTGC CCCAGGCCCC TGTCGTCCAC 
GACGACGTAT ACGTCCCGAC GGTCGAGAGG ATACTGAGGG CGATAGACAA GGTGATGGCC 
TACTCATGA

Protein sequence

MIANMAKALN MALREEMERD PRVVILGEDV GKKGGVFLIT EGLYEKFGPE RVIDTPLNEG 
GIIGFALGMA LAGLKPVAEI QFADFFWLGA DELLNHVAKI RYRSGGNFKA PLVVRMPYGA 
GVKSGLYHSQ SPEAYLVHTP GLVVVAPSTP YNAKGLLKAA IRSDDPVVFL EPKALYRAPR 
EEVPEEDYVV PLGKARIARE GDDVTLVTYG AMLPRCLEAA EKAKASVEVV DLQTLNPMDY 
ETVIKSVSKT GRLVVVHDAP KTGGLGAEVA AIVAEKALHA LTAPVVRVAG PDVPQAPVVH 
DDVYVPTVER ILRAIDKVMA YS