Gene Pisl_0665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_0665
Symbol
ID	4617137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	+
Start bp	604560
End bp	605690
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	44%
IMG OID	639783759
Product	PUA domain-containing protein
Protein accession	YP_930186
Protein GI	119872179
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID	[TIGR00451] uncharacterized domain 2

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.438806
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.11367
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTAT ACGGTATAGA AATAGATTAT GGGCTCTATA AACACTTTCT CGAATATCTC 
TCCGATAACG AAATAGATGC GCTTTTTCAC TCTGTCACAA AGCCCCCCTC TAGATATTAT 
ATAAGGGTAA ATACTACAAA GATAAGCCGT AGAGACTTAA TGAAGAGATT AAACTCCAGG 
GGAGTTCAGG CATACCCGGA CGAACATTTT GACGATGCCC TATGGCTTCC TGTAGAGGGG 
CCTTTTGACA TACCGACAGC CAGGAAACAA GTCATAGTTG ATAAAAAAGC TGCAGAAAGC 
GTAATGCTAG GTGCGGATCT TTACGCACCT GGTATCGTAA AGACAGATCA CGTCAAGGAA 
GGCGACGAAG TAAATATAGT GTCAGACAAC GGCGTAGTCG TTGCCTTTGG AACTGCTGTT 
GTAGATAGTG ATGAAATCTT AAAGACCCGG AGGGGGTTGT ATATAAAGGT AGAGAAATCT 
CTTTACAAAG CACCAAAGAT AAGGGACTTA CCTGAGTATA AAGAAGGCTT GTTGTATAGC 
CAAAGTCTTC CGGCAATAGC TGTGGGACAT GTGGCAAAGA GGGCAAGAGC TTCTACAGCG 
GTAGATCTCA ACGCTGCGCC AGGCGGAAAG GCTACACATT TAGCTCAGAT AGGGCTACGT 
ATAATAGCTG TAGATAGATC TTGGCCAAAA ATAGAGAAGC TAAAAGAAGA GGTTAAGAGA 
CTAGGTCTAG CCGATAGAAT TGACGTCGTT TTACATGACA GTAGATATTT AGATAGAGAC 
TTTCCCCGCT TGGCGGCCGA TTTGGCTCTA GTAGACCCGC CTTGTACAGA CATAGGGGTG 
CGCCCCAAGA TTTATCATAA GGTGACTATA GAGATGGCTA AGACGTTATC TAGATATCAG 
ATCCAGTTTC TCAAGACAGC ACTTAAGATA GCACCGACGG TCATATACTC CACCTGCACA 
CTTACGTATA TAGAAAATGA GGATGTTATA AGGAAAGTAG GCGCAGAGCC CGTTGATACA 
GGATTAGAAA TAGGCGCCCC TGGGTGGGGA TGTCCAGAAT GTAGAAGATT CTTACCTCAC 
ATACATAATA CGCCTGGTTT CTTCATTGCG CTTTTACGCC GCCGGCGTTA G

Protein sequence

MNLYGIEIDY GLYKHFLEYL SDNEIDALFH SVTKPPSRYY IRVNTTKISR RDLMKRLNSR 
GVQAYPDEHF DDALWLPVEG PFDIPTARKQ VIVDKKAAES VMLGADLYAP GIVKTDHVKE 
GDEVNIVSDN GVVVAFGTAV VDSDEILKTR RGLYIKVEKS LYKAPKIRDL PEYKEGLLYS 
QSLPAIAVGH VAKRARASTA VDLNAAPGGK ATHLAQIGLR IIAVDRSWPK IEKLKEEVKR 
LGLADRIDVV LHDSRYLDRD FPRLAADLAL VDPPCTDIGV RPKIYHKVTI EMAKTLSRYQ 
IQFLKTALKI APTVIYSTCT LTYIENEDVI RKVGAEPVDT GLEIGAPGWG CPECRRFLPH 
IHNTPGFFIA LLRRRR