Gene Pars_0089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0089
Symbol
ID	5054298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	81366
End bp	82361
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	56%
IMG OID	640467668
Product	H/ACA RNA-protein complex component Cbf5p
Protein accession	YP_001152356
Protein GI	145590354
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0130] Pseudouridine synthase
TIGRFAM ID	[TIGR00425] rRNA pseudouridine synthase, putative [TIGR00431] tRNA pseudouridine 55 synthase [TIGR00451] uncharacterized domain 2

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGTGCA GTCAGAGAGA GGTTTTCGTC AAGAGGGAGG AGCCTACAAA TCCTGAGTGG 
GGTAAGCCGC CCTCCCAGAG AACTGCTGAC GAGTATATAC GGCACTCATT TGTGATTTTA 
GACAAGCCTC GGGGGCCTAG TAGCCACGAG GTGGCGGCGT GGGTGAAGAA GATTCTGGGC 
GTGGAGCGGG CCGGCCACGC GGGGACGCTG GACCCGAAGG TGTCGGGGGT GTTGCCAATT 
GCAGTGGCTG AGGGGACTAA GGTGTTGATG GCCCTGTCTA GATCCGACAA GGTCTATGTG 
GCTGTGGCTA AGTTCCACGG AGATGTGGAT GAGGAGAGGC TTAGGGCTGT GTTGCGGGAG 
TTTCAGGGAG AGATATACCA AAAGCCGCCG CTCCGCTCTG CGGTGAAAAG GCAGTTGCGG 
ACGCGTCGGG TTTTCTCGCT TGAGCTTCTA GAGTTGGAGG GGCGGTATGC CGTTATTAAG 
ATGCATGTTG AGGCTGGGAC ATACGCCCGC AAGATTATAC ACGACATCGG CGAGGTTCTC 
GGCGTAGGCG CCAATATGAG AGAGTTGAGG CGCGTGGCAG TCACCTGCTT TACTGAAGAC 
GAGGCTGTTA CTTTGCAAGA CGTGGCCGAC GCGTATTATA TCTGGAAGAA ATACGGCGAC 
GACACGTATC TAAGGAGCGT CCTGTTGCCT ATTGAGGAAA TTGCCAGGCA TTTGCCGAAG 
ATTTGGGTAA GGGACAGCGC CGTAGACGCC GTGTGCCACG GCGCACCTCT AGCTGCGCCG 
GGCATATCGA AGTTCGAGGT GCCGTTTTCC AAGGGGGACA TAGTCGCCAT GTTTACTCTG 
AAAGGCGAGC TTGTAGGGAT TGGTAGGGCT CTGGTAGACT CGGAGGAGGT GAAGAAAATG 
GAGAGGGGGG CCGTGGTTAG GACAGACAGG GTCGTCATGA GGCGGGGCAC ATATCCGGCT 
ATGTGGAAGA AAGGCCAAAG AGCCGCAAAA ACTTAA

Protein sequence

MRCSQREVFV KREEPTNPEW GKPPSQRTAD EYIRHSFVIL DKPRGPSSHE VAAWVKKILG 
VERAGHAGTL DPKVSGVLPI AVAEGTKVLM ALSRSDKVYV AVAKFHGDVD EERLRAVLRE 
FQGEIYQKPP LRSAVKRQLR TRRVFSLELL ELEGRYAVIK MHVEAGTYAR KIIHDIGEVL 
GVGANMRELR RVAVTCFTED EAVTLQDVAD AYYIWKKYGD DTYLRSVLLP IEEIARHLPK 
IWVRDSAVDA VCHGAPLAAP GISKFEVPFS KGDIVAMFTL KGELVGIGRA LVDSEEVKKM 
ERGAVVRTDR VVMRRGTYPA MWKKGQRAAK T