Gene Pisl_0972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_0972
Symbol
ID	4617292
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	+
Start bp	868938
End bp	870356
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	47%
IMG OID	639784071
Product	thiamine biosynthesis protein ThiI
Protein accession	YP_930491
Protein GI	119872484
COG category	[H] Coenzyme transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0301] Thiamine biosynthesis ATP pyrophosphatase [COG0607] Rhodanese-related sulfurtransferase
TIGRFAM ID	[TIGR00342] thiazole biosynthesis/tRNA modification protein ThiI

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.493614
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAACGTG TCTTAATAGT GAGGGTAGGC GAGCTAACCA TCAAGAGAGG CAAGACACGT 
GTAGAAATGG AAAGACTTTT GCTAAGAGCC GCCAAAGAGG CGGCAACAGA ATGCGGCAAC 
GTTAGATTTG TCAGAGAACC CGGGAGGATA TATGCACTCG GCGATATCGA CTGTTTAAGA 
AATAAGCTCT CGAGAGTATT TGGCGTAAAG TCTGTAAGTC CGGCGTATGT AATTATTTTC 
GAAAAGATAG AGGATATTGT AGATGCAGCG TTAAAACTCT GGGGTAGCGC GGTGGCGGGG 
AGAAAGTTCG CCGTGAGAGT GCATAGAGTT GGTGAGCATA GCTTTACGTC TAGAGATATA 
GCTATTGCAG TAGGCGCCGT GTTAACAAAA GCAGGAGGCA AAGTGGATTT GGAAAATCCA 
GAAGTTGAGC TTTTTATAGA AGTGCGTAAT AACCGCGCGT TTCTATACAC AGAAGTTATA 
GAAGGGCCTG GCGGCCTTCC CATAGGCTCA GAGGGAAAGG TCTTGGCGTT GGTATCAGGC 
GGAATAGACT CGCCTGTCGC CGCGTGGATG ATGATGAGGA GGGGGGCTCA TGTCGATGTC 
TTTTACTGTA ACCTAGGCGG TACATTTGTC GCCAGGCTTG TCGTAGAAGT TATAAAGAGA 
CTTCTCTCTT GGTCCTACGG CTATAACGCC CGCGTAGTTA TTACAGACTG TGCACCTATA 
GGCCGCACGA TACGTAGAAA TGTTAAAGAA GAGCTGTGGA ATATCGCTTT TAAGCGCGCG 
TTATATCTCA CAGCCCGCAA AGTGGCAGAC ATAGTTAGGG CAACTGCACT AGTGACGGGC 
GAATCGTTAG GGCAAGTATC GTCGCAAACT TTACAAGCCC TAGCTGCGGT TGAGAGAGGG 
CTAGATATTC CAGTTATGAG ACCCCTAGTA GGGATGGATA AAGATGAAAT TATACAACTG 
GCCAGGAAGA TAGGCACATA CGAGCTGTCT ATAAAGATAC CGGAGTATTG TGCCATATTT 
AGCAAGAGAC CTAAGAAGTG GGCCACTAGA GAGGAGATAG AGGAGATAGA CTTAGCGATA 
TACGACGCAG TAATAGAGGT TGTGAAAAAT ATAAAAATTG TCAAGAAACG AGAGCTAGAT 
AGCTATATAG CGTCTCTATC CCCCCCGCAA GACATAGAGA TAGAAAGCTT GCCTCCAGAC 
GCCGTTTTGA TAGACTTACG AGACCAAAAG TCTTTTCAAA AATGGCATCT CCCAGGAGCT 
TTAAGAGCCG ACCCAGACGA CGTACTAACA TTAGTAGATA GACTGGGGCA CGATAAAACC 
TACGTCTTTT ACTGCTACAG CGGAGGTCTT AGCCTAGACG TCGCCGAGAG TCTCCGCAAA 
TTTGGAGTAA AGGCGTATTC GCTTAAACTA CGTAAATAG

Protein sequence

MERVLIVRVG ELTIKRGKTR VEMERLLLRA AKEAATECGN VRFVREPGRI YALGDIDCLR 
NKLSRVFGVK SVSPAYVIIF EKIEDIVDAA LKLWGSAVAG RKFAVRVHRV GEHSFTSRDI 
AIAVGAVLTK AGGKVDLENP EVELFIEVRN NRAFLYTEVI EGPGGLPIGS EGKVLALVSG 
GIDSPVAAWM MMRRGAHVDV FYCNLGGTFV ARLVVEVIKR LLSWSYGYNA RVVITDCAPI 
GRTIRRNVKE ELWNIAFKRA LYLTARKVAD IVRATALVTG ESLGQVSSQT LQALAAVERG 
LDIPVMRPLV GMDKDEIIQL ARKIGTYELS IKIPEYCAIF SKRPKKWATR EEIEEIDLAI 
YDAVIEVVKN IKIVKKRELD SYIASLSPPQ DIEIESLPPD AVLIDLRDQK SFQKWHLPGA 
LRADPDDVLT LVDRLGHDKT YVFYCYSGGL SLDVAESLRK FGVKAYSLKL RK