Gene Tpen_1046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_1046
Symbol
ID	4600789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	+
Start bp	985547
End bp	986827
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	64%
IMG OID	639773824
Product	phosphonopyruvate decarboxylase-related protein
Protein accession	YP_920449
Protein GI	119719954
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3635] Predicted phosphoglycerate mutase, AP superfamily
TIGRFAM ID	[TIGR00306] 2,3-bisphosphoglycerate-independent phosphoglycerate mutase, archaeal form

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.822393
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCTGG TATACCTGGT ATTGGACGGC GTTGCTGACA AGCCGGAGGA TGGTCCAACG 
TCGCTCGAGG TTGCCAGGAA GCCCGCCCTC GACGGGGTCG CCTCCAAGTC TGCGTGCGGC 
CTCGTATACA CGGTGGGCAG GGGGGTTGCG CCGGAGAGCG ACGCTGCCGT CTTCTCCATA 
CTGGGCTACG ACCCCCACAC CGAGTACACG GGTAGGGGGC CCATAGAGGC TGTGGGCGCC 
GGCCTAGAGA TAAGGGAGGG CTTCGAGGTC GCCTTCAGGG CAAACTTCGC GACTGTAGAC 
CCCGAAACGA GGAGGATTAT CGACAGGAGG TGCGGGAGGA ACCTCTCGAG CGAGGAGGCC 
CGCGAGCTCG CGCGGGCACT GGACGGCGTG GACCTCGGGG TGCACGACGG GTACGCGCGT 
GTAGTGGCGA CGGTCGGGCA TAGAGCTGTC GTCGTCATCG GGAGTAGGTC GAGGAGGCTC 
TCGGACAACG TGGGCAACAC GGACCCCGCT TACGAGAAGA GGGGCTACGT ATCCGTAGCG 
AAGCCCAGCT TTGAGCCGTT CGTGGCGGAG GCGCGCCCCC TCGACGACTC GGAGGAGGCT 
AGGCGGACGG CGGACCTCGT GAATGCCTTC ACCGAGCTCT CCATAAGGGT TCTCCGAGGC 
CACCCCGTGA ACATGGCGAG GGCCAGGGAG GGGAAGCTAC CGGCGAACGC GATACTCTTG 
AGGGACTCCG GGGGGAGGCT TCCGAGGCTC CAGAGGATAA GCGAGAAGTA CGGGTTGCGC 
TTCGGCGCAG TCGCCGAGAT GCCCGTCGAG ATAGGCATTG CGCGGATACT GGGGATGGAC 
ATGGCGAGCG TCCCGCCGCC CAGCGAGGAC AAAGCCAAGG ACTACGCCGA CAGGCTTGAA 
GCCACCCTGA AGCTACTCGA GAGGAACGAC GTGGTATACG TCCACCTGAA GGGGCCCGAC 
GAGCCGGGCC ACGACGGGGA CCTTAAGAGG AAGGTTGAAG CAATAGAGGC TATCGACAAG 
TACTACCTGG CGCCGCTCCT AAGGGAGATA GACCCCGCCA CCACGGCGCT ACTCGTAACT 
GCAGACCACG CCACGCCTTA CACCAGAAAA TCCCACACGG ACGACCCGGT ACCCCTAGCC 
CTGATGGCTC CCGGAGTAAC GCCCGACGGC GTCCCGAGGT TCACGGAGAA AGAGTGCTCC 
CGAGGCTCCC TCGGAGTCTT CGAGCACGGC TACGAGGTGC TCCCGCGGCT CCTGGAGAGG 
CTTAGGAGGG TCTACGCTTA A

Protein sequence

MKLVYLVLDG VADKPEDGPT SLEVARKPAL DGVASKSACG LVYTVGRGVA PESDAAVFSI 
LGYDPHTEYT GRGPIEAVGA GLEIREGFEV AFRANFATVD PETRRIIDRR CGRNLSSEEA 
RELARALDGV DLGVHDGYAR VVATVGHRAV VVIGSRSRRL SDNVGNTDPA YEKRGYVSVA 
KPSFEPFVAE ARPLDDSEEA RRTADLVNAF TELSIRVLRG HPVNMARARE GKLPANAILL 
RDSGGRLPRL QRISEKYGLR FGAVAEMPVE IGIARILGMD MASVPPPSED KAKDYADRLE 
ATLKLLERND VVYVHLKGPD EPGHDGDLKR KVEAIEAIDK YYLAPLLREI DPATTALLVT 
ADHATPYTRK SHTDDPVPLA LMAPGVTPDG VPRFTEKECS RGSLGVFEHG YEVLPRLLER 
LRRVYA