Gene Ssol_1202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1202
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1116654
End bp	1117832
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	35%
IMG OID
Product	DNA-directed RNA polymerase, subunit A''
Protein accession	ACX91440
Protein GI	261601837
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.551072
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGATG AGAAAGATAA GCCCTATTTA GAGGAGAAAG TGAAGCAAGC TTCCAATATC 
CTCCCTCAAA AAATTGTAGA CGATTTGAAA AATTTGATAT TAAACAAGGA AATAATAGTG 
ACGAGAGATG AGATTGATAA AATCTTCGAT TTGGCTATTA AAGAGTATAG TGAAGGGTTA 
ATAGCTCCAG GAGAGGCTAT TGGAATTGTA GCCGCACAGT CAGTAGGTGA GCCCGGTACC 
CAAATGACAT TAAGGACTTT CCATTTTGCG GGTATAAGAG AGTTAAATGT AACTTTAGGA 
CTTCCAAGGC TAATAGAAAT TGTGGATGCG AAGAAAGTTC CATCTACTCC AATGATGACT 
ATTTATTTAA CTGATGAATA CAAGCGTGAT AGGGATAAAG CGTTAGAAGT CGCCAGAAAA 
TTAGAATATA CGAAAATAGA AAATGTAGTG AGTTCAACTA GTATCGATAT AGCCTCAATG 
TCCATTATTC TCCAACTCGA TAATGAAATG TTAAAAGATA AAGGCGTTAC TGTAGATGAT 
GTTAAAAAAG CTATAGGTAG ATTGAAATTA GGAGATTTTA TGATAGAAGA ATCTGAGGAT 
AGTACATTAA ACATAAATTT CGCTAATATA GATAGTATAG CTGCGCTATT TAAACTAAGG 
GATAAGATAC TTAATACCAA AATAAAGGGA ATAAAGGGTA TAAAACGTGC TATAGTCCAG 
AAAAAGGGCG ATGAGTATAT CATTTTAACC GATGGTTCAA ATTTATCTGG TGTTCTTAGT 
GTAAAAGGAG TTGACGTAGC TAAAGTAGAG ACTAATAATA TCCGTGAGAT TGAGGAAGTA 
TTTGGAATAG AAGCGGCAAG GGAAATTATA ATTAGGGAGA TTAGTAAAGT ATTAGCAGAA 
CAAGGATTGG ATGTTGATAT AAGGCATATA TTATTAATTG CGGACGTGAT GACGAGAACG 
GGTATTGTAA GGCAGATAGG TAGACATGGT GTAACTGGAG AGAAGAATAG TGTATTAGCA 
AGAGCTGCAT TTGAAGTTAC TGTAAAACAT CTTTTAGATG CTGCGGCTAG AGGAGATGTA 
GAAGAATTTA AAGGTGTAGT AGAAAACATT ATAATTGGTC ATCCAATTAA ACTAGGTACT 
GGAATGGTTG AATTAACAAT GAGGCCGATA TTAAGGTGA

Protein sequence

MIDEKDKPYL EEKVKQASNI LPQKIVDDLK NLILNKEIIV TRDEIDKIFD LAIKEYSEGL 
IAPGEAIGIV AAQSVGEPGT QMTLRTFHFA GIRELNVTLG LPRLIEIVDA KKVPSTPMMT 
IYLTDEYKRD RDKALEVARK LEYTKIENVV SSTSIDIASM SIILQLDNEM LKDKGVTVDD 
VKKAIGRLKL GDFMIEESED STLNINFANI DSIAALFKLR DKILNTKIKG IKGIKRAIVQ 
KKGDEYIILT DGSNLSGVLS VKGVDVAKVE TNNIREIEEV FGIEAAREII IREISKVLAE 
QGLDVDIRHI LLIADVMTRT GIVRQIGRHG VTGEKNSVLA RAAFEVTVKH LLDAAARGDV 
EEFKGVVENI IIGHPIKLGT GMVELTMRPI LR