Gene Ssol_2242 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2242
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	2021537
End bp	2022724
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	34%
IMG OID
Product	conserved hypothetical protein
Protein accession	ACX92430
Protein GI	261602827
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGTGA AATATATTCT TGTAGTGATA ATAATAATAA CGTTTATAGT AAATATTGTA 
TCTCTATTTT ACTTAAACTC TCAAATAGCA AGTCTGTCAT CAAGCTATAA TACATTAGTC 
AATAACTATA ATACTTTAAG GACCTACTAC CAAAACCTCA ATTCCAATTA TACTACACTT 
TACTCATCAT ATTCTAATCT AGTTAACTCT TATAATTCGT TATCATCTCA ATATGCAAAG 
CTATCTTCAG AATACAATAC GCTTATGGCA AAGTACGATA ACTTAACCGC AAAGTATAAC 
ACTCTATCTC AAAATTACAC CATATTGTCA GGTCAGTTAG CCCTAACAAT GGGCACAATG 
ACTGTTCAGT CATTCTATAT TTATTTAGCA CAAGTAAACA CTCAAGGCAT GGAAAGTTTA 
TTAGTAGGAC CTCTAGCATC TTACTTCGAA ATAACGTCAC CACCTGGTAA TGGTACTATA 
ATAGCTTCCC CAGCGAATTC TTCAGATGCA CTTCCTCTTA TTGGATCTAA GTTATCCCAA 
TTCTTCAACT ATTTAAGTGT AAAAACTGAG GTTAAAGAAC TTGTAATTAC TCCCTTGGAA 
AACTACGTAT TGGGAGAGGG TTTGGTTTCA TTTAATGACC AATATGCTAA TGGAACAATT 
GTTACAAATT ACGCACTAAT CACAGTAGTT GCGCAAGAGA TTAACTTATC CACTTGGCAA 
GTTGTATATG TAAAGATTAA CAACGCGCTC ACACAAAGTC AATATAACAC GTTAGTAACG 
CTTTTCAACT TAATCCAAGC GTTAGAATCT AAGAATATAG GTCAATTACA ATCCATATTA 
GTTGGTCCTT ATCAAAGTTA TGTGTATATA GCCCGAGGAC CTTACGCTGG TAATTATTCT 
GGATTAGATG TACCTAATGT TTTCATAGAC ACTATAATAT CTAAGGATGT AAGTTCACTA 
CAATTTGAAT TATATTACTT TAACATAACT CCATTAAACC CCACTACTAG CTTAGTTGAT 
ATGTATGGCG TACTTAAGAT TACCCTCTCA AACGGTTCTA CTTACACTTC CTATACAGAT 
CTCCGCACAA CAGTGGAACT AGAACCTAAC GGGGTACCTC AAGTAGTTGC ATTAAATATA 
ATTAATGATC TAACTCAACA ACAAGTAGTT TCTGCATTGC CAAAATGA

Protein sequence

MDVKYILVVI IIITFIVNIV SLFYLNSQIA SLSSSYNTLV NNYNTLRTYY QNLNSNYTTL 
YSSYSNLVNS YNSLSSQYAK LSSEYNTLMA KYDNLTAKYN TLSQNYTILS GQLALTMGTM 
TVQSFYIYLA QVNTQGMESL LVGPLASYFE ITSPPGNGTI IASPANSSDA LPLIGSKLSQ 
FFNYLSVKTE VKELVITPLE NYVLGEGLVS FNDQYANGTI VTNYALITVV AQEINLSTWQ 
VVYVKINNAL TQSQYNTLVT LFNLIQALES KNIGQLQSIL VGPYQSYVYI ARGPYAGNYS 
GLDVPNVFID TIISKDVSSL QFELYYFNIT PLNPTTSLVD MYGVLKITLS NGSTYTSYTD 
LRTTVELEPN GVPQVVALNI INDLTQQQVV SALPK