Gene Ssol_0072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0072
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	62341
End bp	63846
Gene Length	1506 bp
Protein Length	501 aa
Translation table	11
GC content	37%
IMG OID
Product	carbohydrate kinase, YjeF related protein
Protein accession	ACX90373
Protein GI	261600770
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTTCGG TAAAAGAAAT GAGGGCTTTG GAAATAAATA GTTCTGCTTT AGGCGTATCT 
ACATTATTAC TCATGGAGAA TGCAGGTAGA TCCGTTAAAG ACGAAATAGT AAAGAGATTT 
AACGTAAAGG ATAAGGTAGC ATATGTTTAT GTAGGACATG GTGGAAAAGG TGGTGACGGG 
TTAGTAGCGG CAAGACATTT AGCCGATGAA GGTGCTAAGG TAACCGTAAT TTTATTGGGA 
GAAAATAAAC ACGAGGATGC AATCCTTAAT CTTAATGTCA TAGAAGAGAT GGACTATTCA 
ATAACGTTAG TTGAGATAAA GGATATGGAT GAACTAAAGC CAATCTCTGC TGATATTTTA 
ATCGATGCCA TGTTAGGTAC GGGATTCTCT GGAAAGCCAA GAGAACCGTT TAGAAGTGCG 
ATAAAAGCGT TCAACAATAG TAAAGGGTTC AAGGTCTCTA TAGACGTTCC CTCCGGGATA 
AATGCTGATA CTGGTGAAGC ATATGAAGAC GAGTATGTTA AACCGGATCT GGTTGTCACC 
TTTCACGATA TCAAACCTGG CTTATTAAAG TATAATTTCA ATACTGTGGT TACGAAAATA 
GGTATTCCAG TAGAAGCCGA AATATATGTT GGGCCAGGGG ATTTAATAGT TAACGCGCGT 
AGTAGACCTT ATTACTCTAA GAAGGGTGAT AGCGGAAGAG TACTAGTAAT TGGAGGAAGT 
TACACTTTTA GTGGTGCTCC AACTCTAGCC GCTTTGGGTG CTTTGAGAGC TGGAGCTGAC 
CTAGTTTATG TAGCATCACC AGAGGATACG GCTAGAATTA TAGCGGGATA CTCTCCAGAC 
TTAATTACAA TAAAATTAAG GGGAAAGAAC ATTTCTCCAG ACAATTTTGA AGAATTGAAA 
TTATGGATAG ATAGAGCTGA TGTGGTAGTT ATAGGTCCGG GAATGGGTCT AGCTGAGGAG 
ACTATTGAGG CTTCTAAACT AATTGTGAAT TATCTTAAAG AGAAGAATAA GCTAGCTGTT 
ATTGATGCTG ATGCACTTAA GGCAATAAGT GGGTTCGATT TGTATGAGAA TGCTGTAATA 
ACACCTCATG CAGGCGAATT CAAAATATTC TTTGGAGAAG AACCAGATAA GAACATAAGA 
GATAGAATAA GCCAAGTAAT TACTTATGCT AAGAAATGTA AATGTACAGT TCTACTTAAG 
GGTTATGTTG ATATAATAAG TGATGGTAAA AGGTTTAAAT TAAATAAAAC TGGTAACCCA 
GGTATGACTG TAGGTGGGAG CGGGGATACG TTGACTGGTA TAACAGCAAC ATTAATGGCT 
CAAAAAATCG AACCATTTAT AGCCGCATAT TTAGGGGTTT TCATAAATAG CCTAGCTGGA 
ACTTTAGCAT ATAATAGGCT CGGAGCTCAT TTGACACCTA CTGACATAAT AAATGAAATT 
CCAAATGTGA TAAATAATCC CTTGGATTCT TTCAAAAGAA AATTGTATAA AAGAGTTTTA 
AGTTGA

Protein sequence

MISVKEMRAL EINSSALGVS TLLLMENAGR SVKDEIVKRF NVKDKVAYVY VGHGGKGGDG 
LVAARHLADE GAKVTVILLG ENKHEDAILN LNVIEEMDYS ITLVEIKDMD ELKPISADIL 
IDAMLGTGFS GKPREPFRSA IKAFNNSKGF KVSIDVPSGI NADTGEAYED EYVKPDLVVT 
FHDIKPGLLK YNFNTVVTKI GIPVEAEIYV GPGDLIVNAR SRPYYSKKGD SGRVLVIGGS 
YTFSGAPTLA ALGALRAGAD LVYVASPEDT ARIIAGYSPD LITIKLRGKN ISPDNFEELK 
LWIDRADVVV IGPGMGLAEE TIEASKLIVN YLKEKNKLAV IDADALKAIS GFDLYENAVI 
TPHAGEFKIF FGEEPDKNIR DRISQVITYA KKCKCTVLLK GYVDIISDGK RFKLNKTGNP 
GMTVGGSGDT LTGITATLMA QKIEPFIAAY LGVFINSLAG TLAYNRLGAH LTPTDIINEI 
PNVINNPLDS FKRKLYKRVL S