Gene Pisl_1067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_1067
Symbol
ID	4616370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	-
Start bp	961619
End bp	962869
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	59%
IMG OID	639784163
Product	IS605 family transposase OrfB
Protein accession	YP_930583
Protein GI	119872576
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGAGCAG AGGAGGGCGA GCCGAAGAAG AGGGGCGGAA AGAGCGGCGG GAAAAGCGCC 
GAGAGAGGCA AGAAGAAAGA CGCGGAGAAG AAGAGGGATC ACGTCCTCAC TCGCGCCGTC 
GTAATCCCCA GCGCCCGCCT CAGCTGGAGG AAGTTCAACG CGTTGAAGGA GCTTGAAAAG 
AAGTACAGAG AGCTGAGGAG GAGGCACCCC GACCTCCCAT CCCACTACGT CTACACGGCG 
GCGCAGGACG CGGCCACACG CGTAAAGAGC TTTATGGCGC TGAAGCGCGA GGGCAAGGCG 
AAGACGGAAA AGCCAGAAAT ACGAAGGATC AGCATCTGGC TTGACGACCG CCTCTGGAAG 
CCAGAGGGCT ATACCGCCAT AAGGGTGTCA ACGCACAGAG GTCGGATAAC GATACCGCTT 
TGGCCGACCA AGCAGTTCTG GAAGCACCTC AACGGCGGCT GGAGGCTGAA GTCGCAGCCG 
AGGCTAAAGC TGGACGAAAA GAGGAGGGCG GTCTACGTCT ACTTCGTCTT CGAGAAGGTT 
GTAGAGGAGA GGCCGGCGAA GGGCATCATC GCCGTTGACC TCAACGAGAA CAACGTGGCT 
GTGAAGGCCG GCGGCAGGGT ATACATCCTT GAGACCGGGA TTAGGAACAT CACTGTGGGA 
TACCACAGCC GTAGGGAGGT CATGCAGTCT CTCAAGGGCA ACCGCTATAC AAGCCGCGCG 
CTGAAGAGAA ACGAGCTGAA CAAGAAGAGC GACATTAGGA GGAAGGCGGC CAATTTCGTA 
GTCAGAGAGG CGGAGAGGTT AGGTGCCGCA ATAGCCGTCG AAAATTTGCC AAAGGAAGCG 
CCAAAAAACA TGATATCGAG AGTTGATGAT CCTGTATTAA GAGATAGAAT CTACAAAGCT 
GGCTTTAGAA GTATGTTGAG GAAAATTATA CGTAAGGCAA GGGAGAGGGG GATCCCCGTG 
GTGAAGGTCA ATCCGAGGAG AACCTCCTCC ACCTGCCCGC GGTGTGGCGG GGGGCTTGCG 
AGGGGCTCTG CCCCGAGGCT CCTCCGGTGC CCCCACTGCG GGCGGGAATG GGGGAGGGAC 
GTCGCCGCCG TCATAAACAT CGAAAGGAGG GCACTCGAGG AGGGCCGCGT GCCGCCCGGC 
CCCATGCCCG ATGACCCCAT GCCCGAGGTA GCCTGGCTAC CAATGGGGGC GTGGGCGAGG 
AGAAAGTCCC TAGGCGCGAT TAGTCAAGAA TTGTCAGCTA TGACCGCCTA G

Protein sequence

MGAEEGEPKK RGGKSGGKSA ERGKKKDAEK KRDHVLTRAV VIPSARLSWR KFNALKELEK 
KYRELRRRHP DLPSHYVYTA AQDAATRVKS FMALKREGKA KTEKPEIRRI SIWLDDRLWK 
PEGYTAIRVS THRGRITIPL WPTKQFWKHL NGGWRLKSQP RLKLDEKRRA VYVYFVFEKV 
VEERPAKGII AVDLNENNVA VKAGGRVYIL ETGIRNITVG YHSRREVMQS LKGNRYTSRA 
LKRNELNKKS DIRRKAANFV VREAERLGAA IAVENLPKEA PKNMISRVDD PVLRDRIYKA 
GFRSMLRKII RKARERGIPV VKVNPRRTSS TCPRCGGGLA RGSAPRLLRC PHCGREWGRD 
VAAVINIERR ALEEGRVPPG PMPDDPMPEV AWLPMGAWAR RKSLGAISQE LSAMTA