Gene Pisl_1153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_1153
Symbol
ID	4617463
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	-
Start bp	1045554
End bp	1046621
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	56%
IMG OID	639784249
Product	transposase, IS605 OrfB
Protein accession	YP_930667
Protein GI	119872660
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.00000318591
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGAGCT ATAGAGCGAT TGCGCTTAAA CTGCCGGAGC TGGACTGTGG CGTGGAGCGG 
CTTATGGCGT TGGCGAATCT GGCGCACCGC GGATACCGCG TTGAGCCGCC GGATCTGCCC 
AAGACGGTGT CAATAATGCT GTACAGAAGA AGGCATGAGC TCGCGTTTGG CACAGAGCCG 
AAGAGGTGGC TTGCCAGAAC GTGGTTTCCT CTCACAACCC TTAGGATTGG GAACGGTCAA 
AAAATCGGCG ACGGTGGGGC CCCCGTCGTG TTGGACTTCG ACAGAGGAGT TGTGAAGCTG 
AGGTTTATCT GCCACGCCGA GGTGCCCATG CCGAAGTGGG CCTACGACAG GGTCTCCGAG 
GGCGGCGACG TGAAGTTCGC CCTCCTTGGT CTCAAGAGGG GGAAGCCGCA CCTAGCGCTG 
GTGGCGGAGC GTGAGGTCGA GCTGATACAG ACGAATAGCG TCCTAGTGGT AGACGTCAAT 
TCGTGGAGAC ACGGCGTTGT GTGGGCTCTG ATCAGAGACG GAAAAACAAC AAAGTGGGCG 
CGAGTGAGAC CGGACTTGGG ATACATAGAG CGGCTATACA GCGAGGTCGT CAGACTTGAG 
CACAAATACG GAAAGCTGGA GAGACTTGGT CTCCACGAGG GCAGAGACAG CAAGAAGCTG 
TGGAGACAGA TAAAGCAGAA GAGGAGACGG CTTTACGCAT ACCTCAGAGA CTTTGCGCAA 
AAGGCGGCGC ACAGATTGGC ACTGAAGGCC GTGAAGCGCC GAGCGGAGGT TTGGATCGAC 
GACATGTTGG AGGAGTCCAG GAGGGAGCTG ATTGAGGAGA AACTGCCCAG CGACCTTGTC 
AAGCTCTACA TGCTCTACCT CCGTCGCTTT ATCAACTTGT TGACGAACCA ATTGGCGTGG 
TACGGCATTC CGTACAGATT TAAGCGTCTG CCGTCCACCG TGTGTCCAGT ATGCGGTTCC 
GAGCTGACAC AACTGCCCGA CAGAACAATG GTATGTCAAT GTGGATTCAG AGAAAAGAGA 
GACCTAGTGC CGATTAGGTG GGCACTGAAG TACACATCCC CGCCCTAA

Protein sequence

MKSYRAIALK LPELDCGVER LMALANLAHR GYRVEPPDLP KTVSIMLYRR RHELAFGTEP 
KRWLARTWFP LTTLRIGNGQ KIGDGGAPVV LDFDRGVVKL RFICHAEVPM PKWAYDRVSE 
GGDVKFALLG LKRGKPHLAL VAEREVELIQ TNSVLVVDVN SWRHGVVWAL IRDGKTTKWA 
RVRPDLGYIE RLYSEVVRLE HKYGKLERLG LHEGRDSKKL WRQIKQKRRR LYAYLRDFAQ 
KAAHRLALKA VKRRAEVWID DMLEESRREL IEEKLPSDLV KLYMLYLRRF INLLTNQLAW 
YGIPYRFKRL PSTVCPVCGS ELTQLPDRTM VCQCGFREKR DLVPIRWALK YTSPP