Gene Pisl_1907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_1907
Symbol
ID	4617453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	-
Start bp	1722782
End bp	1724083
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	58%
IMG OID	639784998
Product	IS605 family transposase OrfB
Protein accession	YP_931397
Protein GI	119873390
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.128172
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGCAG GGGATATAGA AAAGGGGAGC GGACAGAGGA GGCGGAGCCG GAGGCGCAAC 
AAGAGCAACG CTGAGAAGAA AGACGAGAAG AAAGACGTCT TGACGCACGC CGTCGCCGTC 
CCCAGCCCGC GGCTGAGCTG GAGGAAGTTC AACGCGTTGA AGGAGCTGGA GGAGAGGTAT 
AAGGAGTTCG TCGTCGAGTT CGTTGAATAC GGCTTTAAGC GCGGCGTGAC GGGGCAGGTC 
TCACTCCGCA AGGCTCTGTA CAGCGAGCTG AGGGGGAGGT ACCCCGACCT CCCATCCCAC 
TACGTCTACA CGGCTGCGCA GGACGCAGCC ACACGCGTAA AGAGCTTTAT GGCGCTGAAG 
CGCGAGGGCA AGGCGAAGAC GGAAAAGCCA GAAATACGAA GGATCAGCAT CTGGCTTGAC 
GACCGCCTCT GGAAGCCAGA GGGCTATACC GCCATAAGGG TGTCAACGCA CAGAGGTCGG 
ATAACGATAC CGCTTTGGCC GACCAAGCAG TTCTGGAAGC ACCTCAACGG CGGCTGGAGG 
CTGAAGTCGC AGCCGAGGCT AAAGCTGGAC GAAAAGAGGA GGGCGGTCTA CGTCTACTTC 
GTCTTCGAGA AGGTTGTAGA GGAGAGGCCG GCGAAGGGCA TCATCGCCGT TGACCTCAAC 
GAGAACAACG TGGCTGTGAA GGCCGGCGGC AGGGTGTACA TCCTTGAGAC TGGGATTAGA 
GATATCACAC TCGGCTACCA CAGCCGGAGA GAGGTTATGC AGTCTCTCAA GGGCAACCGC 
TACACAAGCC GTGCGCTGAA GAAAAACGAA CTGAACAAGA AGAGCGACAT CCGGAGGAAG 
GCGGCCAATT TCGTAGTCAG AGAGGCGGAG AGGTTAGGTG CCGCAATAGC CGTCGAAAAT 
TTGCCAAAGG AAGTGCCAAA AAACATGATA TCGAGAGTTG ATGATCCTGT ATTAAGAGAT 
AGAATCTACA AAGCTGGCTT TAGAAGTATG TTGAGGGAAA TTATACGTAA GGCAAGGGAG 
AGGGGGATCC CCGTGGTGAA GGTCAATCCG AGGAGAACCT CCTCCACCTG CCCGCGGTGT 
GGCGGGGGGC TTGCGAGGGG CTCTGCCCCG AGGCTCCTCC GGTGCCCCCA CTGCGGGCGG 
GAGTGGGGGA GGGACGTCGC CGCCGTCATA AACACCGAAA GGAGGGCACT CGAGGAGGGC 
CGCGTGCCGC CCGGCCCCAT GCCCGATGAC CCCACGCCCG AGGTATCTTG GATACCCATG 
AAGGCGTGGG CGAGGAGAAA GTCCCTAGGC ATAACAGCCT AG

Protein sequence

MEAGDIEKGS GQRRRSRRRN KSNAEKKDEK KDVLTHAVAV PSPRLSWRKF NALKELEERY 
KEFVVEFVEY GFKRGVTGQV SLRKALYSEL RGRYPDLPSH YVYTAAQDAA TRVKSFMALK 
REGKAKTEKP EIRRISIWLD DRLWKPEGYT AIRVSTHRGR ITIPLWPTKQ FWKHLNGGWR 
LKSQPRLKLD EKRRAVYVYF VFEKVVEERP AKGIIAVDLN ENNVAVKAGG RVYILETGIR 
DITLGYHSRR EVMQSLKGNR YTSRALKKNE LNKKSDIRRK AANFVVREAE RLGAAIAVEN 
LPKEVPKNMI SRVDDPVLRD RIYKAGFRSM LREIIRKARE RGIPVVKVNP RRTSSTCPRC 
GGGLARGSAP RLLRCPHCGR EWGRDVAAVI NTERRALEEG RVPPGPMPDD PTPEVSWIPM 
KAWARRKSLG ITA