Gene Pars_0010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pars_0010
Symbol
ID	5055890
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum arsenaticum DSM 13514
Kingdom	Archaea
Replicon accession	NC_009376
Strand	+
Start bp	7015
End bp	8148
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	46%
IMG OID	640467590
Product	PUA domain-containing protein
Protein accession	YP_001152279
Protein GI	145590277
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00451] uncharacterized domain 2

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.929374
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTATTATG GAAGTATAGA AATAGATAAC TTACTATATA AACATTTCTT GGAATATTTA 
TCTGACTCGG AAATAGAATC GATGCTACGT TCTGTCCTAA CACCACCGCA ACGCTACTAC 
ATAAGAGTTA ACACGACAAA GATTACACCA AACGAGCTCA TAAAAAGACT TAACCTCCGC 
GGCATCTCAG CCTATAAAGA CGAAGTCTTT GAAGACGCCG TATGGTTCCC CGTAGAAGGG 
CCCTTTAAGA TACCCTCTGC TAAAAAGATT GTAGTTGTTG ACAAAAAAGC AGCAGAAAGT 
ATTATGTTGG GAGCTGATTT ATATGGACCT GCCATAATAA AAACCGACCC CGTAAAAAGC 
GGCGAGGAGG TAAATATAGT GTCGGATAAT GGAGTACTAG TGGCATATGG GAAGGCTGTA 
ATGAACAGCG ACGAGGCGCT CAGAAGTAGA AGGGGGCTTT TTGTACAGGT TGAAAAATCT 
CTATACAAGG CCCCGAAGCT TAGGAATTTG CCGGAATATG CCGAGGGGCT TTTCTACAGC 
CAGAGCCTAC CTGCTATAGC TGTGGGCCAC ATAGCGCGAA AATTCGCACA ACGGAGCGTA 
GTAGACCTTA ACGCGGCCCC CGGCGGCAAA GCCACCCACC TGGCGCAATA CGGAATTCAC 
GTGATTGCTG TAGATAGATC CTCGCCAAAA ATTAGCAAAT TGAAATACGA GGTAGAAAGA 
CTCGGACTCA ACTCGGTCGA CGTTTTGCTA CACGATAGTA GGTATCTAGA TAGGGATTTC 
CCCAAATTAA AAGCGGATGT TGCGCTGGTA GATCCACCTT GCACCGACCT AGGAGTGAGA 
CCTAAGATAT ACCAAAAAGT GACGTACAGC ACGGCCAAGA CATTGTCCAA GTACCAGGTT 
CAGTTTTTAA AAACCGCGTT AAAGCTCGCC GACTACGTAA TTTATTCAAC GTGCACAACC 
ACAGCAATAG AAAACGAAGA AGTGATTAAG AAGTCCGGAG CGGAAATAGT AGACCCGGAA 
ATAAGCATAG GCGCCCCAGG TTGGGAATGT GCAGAGTGTA GAAGATTCTT GCCGCACATA 
CATAACACCC CGGGCTTCTT CATCGCGGTT CTAAAGGCTA AGAAAGCGCC TTGA

Protein sequence

MYYGSIEIDN LLYKHFLEYL SDSEIESMLR SVLTPPQRYY IRVNTTKITP NELIKRLNLR 
GISAYKDEVF EDAVWFPVEG PFKIPSAKKI VVVDKKAAES IMLGADLYGP AIIKTDPVKS 
GEEVNIVSDN GVLVAYGKAV MNSDEALRSR RGLFVQVEKS LYKAPKLRNL PEYAEGLFYS 
QSLPAIAVGH IARKFAQRSV VDLNAAPGGK ATHLAQYGIH VIAVDRSSPK ISKLKYEVER 
LGLNSVDVLL HDSRYLDRDF PKLKADVALV DPPCTDLGVR PKIYQKVTYS TAKTLSKYQV 
QFLKTALKLA DYVIYSTCTT TAIENEEVIK KSGAEIVDPE ISIGAPGWEC AECRRFLPHI 
HNTPGFFIAV LKAKKAP