Gene Ssol_0001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0001
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	105
End bp	1343
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	36%
IMG OID
Product	isocitrate dehydrogenase, NADP-dependent
Protein accession	ACX90307
Protein GI	261600704
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0183219
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAGA TACCAGAAGA TGGAGAAGTA ATTAAATTTG AAAATGGGAA ATGGATTGTA 
CCAAAAAAGC CAATAATTCT GTATGTTGAA GGGGATGGAA TAGGGCATGA AATAACACAT 
GCTGCTATGA AGGTTATAAA CAAAGCAGTG GAAAAAGCTT ATGGATCTGA TAGAGAAATT 
AAGTGGGTAG AAGTTCTAGC AGGAGATAAG GCAGAAAAGC TAACCGGAAA TAGATTTCCT 
AAAGAGTCAG AGGAATTGAT AGAGAAGTAT AGAGTCTTAT TAAAAGGTCC CCTAGAAACA 
CCAATAGGCA AAGGCTGGAA ATCCATCAAT GTAGCAATTA GATTAATGTT GGATCTTTAT 
GCAAATATAA GACCAGTAAA ATACATTCCA GGTATAGAAA GTCCAATTAA GAACGCAGAT 
AAGATTGACC TTATAATATT TAGGGAAAAT ACTGATGATT TGTACAGAGG AATAGAGTAT 
CCTTATGACA GTGAACAAGC AAAGAAAATT AGAGATTTTC TAAGAAAGGA GCTAGGAGTG 
GAAGTGGAAG ATGATACTGG AATTGGTATA AAACTTATCA GTAGATTTAA GACGCAAAGG 
ATTGCGAGAA TGGCTATAAA ATACGCTATA GACCATAAAC GAAAGAAAGT TACAATAATG 
CATAAAGGTA ATGTGATGAA ATATACCGAA GGAGCATTTA GAGAATGGTC ATATGAAGTT 
GCAACAAAAG AATTTAGAGA TTATATAGTT ACTGAGGAAG AGGTAACAAA GAATTATAAT 
GGAGTACCTC CTTCTGGGAA GGTCATAATA AATGATAGGA TAGCTGATAA CATGTTCCAA 
CAGATAATTA TCAGACCAGA CGAGTACGAT ATAATATTAG CACCTAACGT AAATGGGGAT 
TACATATCGG ATGCTGCGGG CGCACTGGTA GGAAATATTG GTATGTTAGG CGGTGCAAAT 
ATAGGAGATA CTGGAGGTAT GTTCGAGGCA ATACATGGTA CCGCACCTAA GTATGCTGGT 
AAGAATGTTG CAAACCCCAC TGGAATAATA AAAGGTGGTG AGTTAATGTT AAGATTTATG 
GGATGGGATA AGGCTGCTGA GTTAATAGAT TCTGCAATCA TGGAATCTAT AAGACAGAAG 
AAGGTTACTC AGGATTTAGC TAGATTTATG GGTGTAAGAG CCTTATCAAC TACTGAATAT 
ACTGACGAGC TAATTGCGAT AATCGATACA CTATCATAA

Protein sequence

MQKIPEDGEV IKFENGKWIV PKKPIILYVE GDGIGHEITH AAMKVINKAV EKAYGSDREI 
KWVEVLAGDK AEKLTGNRFP KESEELIEKY RVLLKGPLET PIGKGWKSIN VAIRLMLDLY 
ANIRPVKYIP GIESPIKNAD KIDLIIFREN TDDLYRGIEY PYDSEQAKKI RDFLRKELGV 
EVEDDTGIGI KLISRFKTQR IARMAIKYAI DHKRKKVTIM HKGNVMKYTE GAFREWSYEV 
ATKEFRDYIV TEEEVTKNYN GVPPSGKVII NDRIADNMFQ QIIIRPDEYD IILAPNVNGD 
YISDAAGALV GNIGMLGGAN IGDTGGMFEA IHGTAPKYAG KNVANPTGII KGGELMLRFM 
GWDKAAELID SAIMESIRQK KVTQDLARFM GVRALSTTEY TDELIAIIDT LS