Gene Pisl_1934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_1934
Symbol
ID	4617555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	-
Start bp	1746646
End bp	1748190
Gene Length	1545 bp
Protein Length	514 aa
Translation table	11
GC content	66%
IMG OID	639785025
Product	carbohydrate kinase, YjeF related protein
Protein accession	YP_931424
Protein GI	119873417
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.0000050145
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTTTTTAT CTGTGTGTAT TGTAGACGAT ATGGAGGCTA TCTCCTCTCT TGAGATGTAT 
GTGGTGGATA GGAACGCGGA GTGGCTTGGG GTGCCGCGGC TTGTGTTGAT GGAGAACGCG 
GGGGCGGCTG TGGCGAGGAA TGTCGTTGGT AGGTTTCCGG GGGCGAGGAG GGTTTTGGTG 
GTGTGTGGGA CGGGGGACAA CGGGGGGGAT GGCTACGTGG CGGCTAGGCA TCTCCACGGG 
GCGGGGCTGT GGGTGAGGGT GGTGGGGCTT GGGGAGCCTA GGGAGGAGTT GGCTAGGGCG 
AATTTCGAGG CTGTGAGGAG GCTGTGGGGG GTGGAGCTGG CGCTGGCGGC GACTCCCCTG 
GAGCTTCTTG CACTTCAGGA CTGGTTCCTC TGGGCGGATG TAATTATAGA CGCAGTGTTG 
GGGACTGGGG TGAGGGGGGC GCTTAGGGAG CCGCACGCCA CCGCGGTCGA CCTCATGAAC 
GCGGCTCCTG CGCCGAAGGT GGCTGTGGAC GTCCCCAGCG GGCTGGACCC GGACACGGGG 
GAGGTGCGGG ACAAGGCGGT TAGGGCCGCC CTCACCGTCA CTTTCCACAA GCCAAAGAGG 
GGCCTCCTGG CTGAGGGGGC GCGGAGGTAC GTGGGGGAGC TGGTGGTGGA GCCCATCGGC 
ATCCCGCCGG AGGCTGAGGT GGTAGTTGGG CCGGGGGACT TCGCCTATCT AGACTTCTCC 
CGGCGGGCCG ACGCGAAGAA GGGAGACCAC GGCCGGGTGC TGGTGGTGGG TGGGTCCCTC 
GAGTACTCGG GGGCGCCTAT GTACGTGGCG CTGGCCGCGC TGAGGTCTGG CGTGGATCTG 
GCGGTTATCG CGGCGCCTGA GCCGGCGGCG CAGGCGGCTA AGGCCTACAG CCCAGACATA 
ATCGCCGTCC CGCTGGAGGG GCCTAGGCTC TCCCTACGCC ACGTGGAGAA GGTGCTGAGG 
CTGGCGGAGA AGTTCGACGT GGTGGCCATC GGCCCGGGGC TGGGGCTGGA GGGCGAGACC 
CCCGACGCGG TTAAAGAAAT AGCCGCGCGG GTCAAAAAAC CGCTTGTCGT CGACGCAGAC 
GCCATAAAAG CCCTCGGGGG GTCGCCGGTG GGGGGGCCCC AGGTGGTGTA CACCCCACAC 
GCGGGGGAGT TCAAAGCGCT GACAGGCGTA GAGCCGCCGA GGGGGCTAAG GGAGAGGGCC 
GAGGCGGTGA GGGAGTGGGC GGGGAGGATC GGCGCTGTCA TACTACTCAA GGGCAGATAC 
GACGTGGCGT CAGACGGGAG GCGGGTCAAG ATAAACACCA CCGGCACCCC CGCCATGACC 
GTCGGCGGGA CAGGCGACGT ACTCACAGGC CTCACCGCTG CGTTTATGAC CAAGACACGT 
GACCCCCTAG AGGCCGCGGC CGTGGCGGCC TTCGTCAACG GGCTAGCCGG CGAGGAGGCC 
GCCGCTCAGC TAGGCTTCCA CATCACCGCC AGCGACCTCA TAGAGAAGAT CCCAAGCGTC 
GTCAGGAGAT ATGCGCGAGA AGACATAACC AGCCCCCGGC CATAG

Protein sequence

MFLSVCIVDD MEAISSLEMY VVDRNAEWLG VPRLVLMENA GAAVARNVVG RFPGARRVLV 
VCGTGDNGGD GYVAARHLHG AGLWVRVVGL GEPREELARA NFEAVRRLWG VELALAATPL 
ELLALQDWFL WADVIIDAVL GTGVRGALRE PHATAVDLMN AAPAPKVAVD VPSGLDPDTG 
EVRDKAVRAA LTVTFHKPKR GLLAEGARRY VGELVVEPIG IPPEAEVVVG PGDFAYLDFS 
RRADAKKGDH GRVLVVGGSL EYSGAPMYVA LAALRSGVDL AVIAAPEPAA QAAKAYSPDI 
IAVPLEGPRL SLRHVEKVLR LAEKFDVVAI GPGLGLEGET PDAVKEIAAR VKKPLVVDAD 
AIKALGGSPV GGPQVVYTPH AGEFKALTGV EPPRGLRERA EAVREWAGRI GAVILLKGRY 
DVASDGRRVK INTTGTPAMT VGGTGDVLTG LTAAFMTKTR DPLEAAAVAA FVNGLAGEEA 
AAQLGFHITA SDLIEKIPSV VRRYAREDIT SPRP