Gene Tpen_0153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tpen_0153
Symbol
ID	4600645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thermofilum pendens Hrk 5
Kingdom	Archaea
Replicon accession	NC_008698
Strand	-
Start bp	130229
End bp	131290
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	60%
IMG OID	639772907
Product	phosphoadenosine phosphosulfate reductase
Protein accession	YP_919566
Protein GI	119719071
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0175] 3'-phosphoadenosine 5'-phosphosulfate sulfotransferase (PAPS reductase)/FAD synthetase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.327935
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAAGT ACCCCTTTCT TTCTCCCAGC GGCAGGAGGG GGTACGTCAG GTCGTTCTCC 
GACTACATAG AAGTGGAGTA CGAGGGCGAA CCCTCCTCCC TCTACCTGTG GTCGCAGGGT 
AGCGGCTCTC TCTACAGGGG TAGCACGGGC TTCTTTAAAA GCGTCTACGA GCCTCCCCTA 
GCCGAGAAGG GGTGGAGCAC CGAAGCCCCC GTTGAAGACC GGGTGGCCGA GGTCGCGCGG 
AGGCATGGCG AGAAGCTTAA GGGTAAGCAC GTAATGGCTG ACCTCAGCGG CGGGAAGGAC 
AGCACGGCTA ACCTCTACCT ACTCACAAAG CTCCAGGAAA TCGTGGGCTT CAAGGTAACG 
GCAGTCTACG TGCACATGCC GTACCTCGAG CCCGTGGAGA ACATAGCCTT CGCGGAGAAA 
GTAGCGTCAA GACTGGGAGT CGACCTGAGA ATAGTCGAGC CGGACAGGAG GAAGCTGGAG 
TTCTACCTGC TGAGGGAGGG GCTCCCGAAG CGCGGCGACA GGTGGTGCAC GTACCTGAAG 
ACTCGCGCCC TAAGAGAGGC GAAGAAGGAG ATAGGGGCCG AGGTTGAGGC TAAAGCCGAG 
AGGGCGCTCG AGGCCGGGAA GCGCTACGAA AGGCTCAGCG GCCTCGCTAA GAGAAAAGTG 
TACTTCAACG GGGGAGTGGT AAACCTCGTC CATGACCTCT CCGCGGCGGA AGTCGCGGGA 
ATAGTTAGGC GCGCCGGCCT CGTACACCCC CACTACCTTC AAGGGTTACC CCGCGTGAGC 
TGTAGGTTCT GCCCGTACAG AGGGCTCTAC GAGCTCGAGG TCTCCTCGAA GCACGAAGTC 
GAGGACGAGG GTCTCGTGGA GTGGGTCATG GCGAGGACCT ATAGGAACTA CTACTCGAGC 
GTTACGCCGC TAGAAACGTT CCTAGAGCTA CACTTGTGGC GCTACACCCC CTCCGTGGCT 
AGGCTCCGCG TGCTGGAAGC GGGCTACGTC GACCCAGACT CGAAAATCTC GCTGAGCGAA 
GCAAGGAAAA TGTTCTCGTG GATATGGGTG GGCAAGGCGT GA

Protein sequence

MEKYPFLSPS GRRGYVRSFS DYIEVEYEGE PSSLYLWSQG SGSLYRGSTG FFKSVYEPPL 
AEKGWSTEAP VEDRVAEVAR RHGEKLKGKH VMADLSGGKD STANLYLLTK LQEIVGFKVT 
AVYVHMPYLE PVENIAFAEK VASRLGVDLR IVEPDRRKLE FYLLREGLPK RGDRWCTYLK 
TRALREAKKE IGAEVEAKAE RALEAGKRYE RLSGLAKRKV YFNGGVVNLV HDLSAAEVAG 
IVRRAGLVHP HYLQGLPRVS CRFCPYRGLY ELEVSSKHEV EDEGLVEWVM ARTYRNYYSS 
VTPLETFLEL HLWRYTPSVA RLRVLEAGYV DPDSKISLSE ARKMFSWIWV GKA