Gene Ssol_1080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1080
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1011963
End bp	1013168
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	35%
IMG OID
Product	putative transcriptional regulator, GntR family
Protein accession	ACX91323
Protein GI	261601720
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGAGA GATTTTTATC CACCGAAACT AAGTATTTAC GTACCTCAGA AATAAGAGAT 
CTACTAAAAC TAACGGAAGG TAAGAATGTA ATTAGCCTTG CGGGAGGTTT ACCTGATCCT 
CAGACTTTTC CAGTAGAAGA AATTAAAAAA ATAGCAGATG ACATCTTATT GAATAGTGCT 
GATAAGGCAT TACAATATAC TGCAACTGCT GGTATATCTG AATTTAGAAG AGAATTGGTG 
AACTTATCTA GATTAAGGGG AATTAGTGGA ATAGATGAAA GAAACGTCTT TGTTACAGTA 
GGAAGTCAAG AAGCACTTTT CATGATATTT AATATATTAC TAGATCCGGG AGACAATGTA 
GTAGTCGAGG CGCCAACTTA TTTAGCAGCT TTAAATGCCA TGAGAACTAG AAAGCCAAAT 
TTCATATCGA TAACAGTAAC GGAAATGGGC CCAGATCTAG ATGAATTGGA GAGAAAAATA 
AAAGATGCCC ATAGCAATGG GAAGAAGGTT AAACTGATGT ATGTGATTCC AACAGCCCAG 
AATCCGGCGG GTACTACGAT GAATACAGAG GATAGGAAAA GACTTTTAGA GATTGCATCG 
AAATATGATT TCTTAATTTT TGAGGATGAT GCTTATGGGT TCTTAGTATT CGAGGGAGAA 
AGTCCACCAC CAATTAAAGC CTTCGATAAA GAAGGAAGAG TAATTTATAC TAGCACATTT 
AGTAAAATAC TTGCACCCGG TTTAAGGTTA GGATGGGTAA TTGCTCATGA AGATTTCATA 
AAGGAAATGG AACTATATAA ACAAAATGTT GATTTGCATA CACCTTCATT ATCACAATAT 
ATTGCAATGG AGGCTATAAG GAGGGGTATA ATTCAAAATA ATTTACCTAA GATAAGGAGA 
GTGTATAAGG AAAAAAGAGA TGTAATGCTA GAGGCTATTG AAACTTATTT CCCTAATGAT 
GCCAGATGGA CTAAACCAGT TGGTGGAATG TTTGTTTTTG CTTGGTTGCC ACAAAAAATA 
GATACTACTA AGATGTTAGA AAAAGCCTTA CAAAGGGGTG TAGCTTATGT ACCAGGTTCT 
AGTTTCTATG CTGACTATAG TGGAAAGAAT ACTATGAGGA TCAACTTTAG TTTTCCTAAG 
AAAGAAGAAT TAATAGAGGG AATTAAGAGG CTAGGAGATA CGATAAAGCA TGAGCTCTCT 
ACTTAA

Protein sequence

MFERFLSTET KYLRTSEIRD LLKLTEGKNV ISLAGGLPDP QTFPVEEIKK IADDILLNSA 
DKALQYTATA GISEFRRELV NLSRLRGISG IDERNVFVTV GSQEALFMIF NILLDPGDNV 
VVEAPTYLAA LNAMRTRKPN FISITVTEMG PDLDELERKI KDAHSNGKKV KLMYVIPTAQ 
NPAGTTMNTE DRKRLLEIAS KYDFLIFEDD AYGFLVFEGE SPPPIKAFDK EGRVIYTSTF 
SKILAPGLRL GWVIAHEDFI KEMELYKQNV DLHTPSLSQY IAMEAIRRGI IQNNLPKIRR 
VYKEKRDVML EAIETYFPND ARWTKPVGGM FVFAWLPQKI DTTKMLEKAL QRGVAYVPGS 
SFYADYSGKN TMRINFSFPK KEELIEGIKR LGDTIKHELS T