Gene Pisl_1708 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_1708
Symbol
ID	4616893
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	-
Start bp	1544733
End bp	1545803
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	40%
IMG OID	639784790
Product	glycoside hydrolase family protein
Protein accession	YP_931202
Protein GI	119873195
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.913199
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.0276874
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGATAG GCGCGGCCGT ATCTCCATAT CAACACTTCG GGTTTTGTAA ATGCGATATG 
CTTGACGAGC CTGGCGCATA TCACATACTT TTTTATGAGG AAGATTTCGA TATCGCCAAG 
GCAGTGGGCC TAGATGTATT TAGAACAGGA ATTGAATGGG CTATAATAGA GCCTAGAGAG 
GGCTATTACG ACAAAGAAGC TCTCAAGCTT TTTAACGAAT ATCTATCGTC TATCAAGAGA 
CGCGGTATAA AGACTTGGGT TACGTTACAC CATTTTACAA ATCCTAGATG GGTGTGGAAA 
TATGGCGGTT GGGAGTCTAA AGACGTGACA AGGAGATTTT TGTCATATGT AGATTATGTT 
GCAAGAGAGC TTGGAGGTCT AATCGACGTA GCTTTAATAT TTAACGAGCC AAGTATGTAC 
ACATTTCTCG CATACATTAG AGGCGACTTG CCACCGTATG GTTTCATGTC GCTTAAACAT 
ATGAGAAGGG CACTATCAAA CATAAATGAG ACTATTCTCA TGGCTAGAGA CATATTAAAA 
AACTATGGCG TAGTAAAATC TTTTACACAT TCATTTACAA AGTTTGAGTC TAAAAATGCT 
ATATTTAAAC CGATTATCTA TTTTATAAAT AGGTTAAACT CAAAATACTT AGCAATGTTT 
AAAGAAATGG ATTATACATC TATAAATTTT TATGTCGTAG GTAGATATGA AGATTTTTCA 
ATGCGCTTCC TATACAGACC TAAGAGTTTG TTAGAAATAA AACCGCCCAC GCCTCTCGCA 
GTGACAGAGT TTGGAATAGC CACAAGAGAT GAAGAGCTTA GGTATAGATA CCTCTGCTCT 
ATGGCACACG TATTTAAAGA AGTAAAGCCT ATTGTTGCAA TTTGGTGGAG TTTTTTGCAT 
GGCTATGAAT GGGGACTAGG ATATCAGCCT TTTTTCGCGC TTGTTGATAT AAAAGGCACT 
AGACGTATAT TAACACGGTT AGCTAAGGTC TTTAGGACGA CTCTGGAGAA TCCCCCCCGT 
TGCGAGTTTG TGGAGAGAGA CGCCGGGCTT GAATGGCGTT GGCACCTATA G

Protein sequence

MQIGAAVSPY QHFGFCKCDM LDEPGAYHIL FYEEDFDIAK AVGLDVFRTG IEWAIIEPRE 
GYYDKEALKL FNEYLSSIKR RGIKTWVTLH HFTNPRWVWK YGGWESKDVT RRFLSYVDYV 
ARELGGLIDV ALIFNEPSMY TFLAYIRGDL PPYGFMSLKH MRRALSNINE TILMARDILK 
NYGVVKSFTH SFTKFESKNA IFKPIIYFIN RLNSKYLAMF KEMDYTSINF YVVGRYEDFS 
MRFLYRPKSL LEIKPPTPLA VTEFGIATRD EELRYRYLCS MAHVFKEVKP IVAIWWSFLH 
GYEWGLGYQP FFALVDIKGT RRILTRLAKV FRTTLENPPR CEFVERDAGL EWRWHL