Gene Ssol_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2010
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1805358
End bp	1806596
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	34%
IMG OID
Product	CCA-adding enzyme
Protein accession	ACX92218
Protein GI	261602615
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATAGAGG AGGAAGTACT GAAGATAATA AAACCCACTG AAGAAGACAA AAAAGGAATA 
GAAAAAGTAT TGGAAATCAT TAGGGAAAGG TTAAATAAAT TAGATTTCGA GGTCGAGGGA 
TCATTTAGGA AAGGAACTTG GCTAAGACAA GATACAGATA TAGACGTCTT CGTATTTTAT 
CCTAAAGATG TTGGAAAAGA ATATCTAGAA AGAAACGCTC TAAACGATAT TATTAACAGA 
ATAAAAGATC TCGATTATAC TTTAGCATAC GCTGAACATC CGTATGTGAT AGTCAATATA 
AATAACGTAG AAGTAGATAT AGTCCCAGCC TTGAGAGTGG AAAGCGGAGA TAAGGCAATA 
ACTGCAGTTG ATAGAACACC ATTCCATACG AAATACGTTA CTTCCCACTT GGACGAAAGA 
GGAAAAGATG AGGTTAGATT ACTTAAAAGG TTCATGAAAG GAATAGGCGT TTACGGGGCT 
GAATTGAAAG TACAAGGATT CTCTGGATAT GCAACAGAAC TCTTAATTAT ATATTATGGA 
AATTTTAGAA AAGTTCTAGA AGAGGCCTCA AAATGGAAGC ATCCAATAAA AATAGAATTA 
ACGAAACCAA TGAAAATTTT TTCTGAGCCA TTAATTATCC CAGACCCAGT AGACCCTAAA 
AGAAATGTAA CCGCCGCAGT GTCATTAAAA AATATAGCGA CATTTTCCAT TGCCGCAAAA 
TATTATCTAA AAAACCCCTC TATAGAGTTC TTCTTTCCAT CAAAAAAAGT AGAGGAAAAA 
GTTAAGGGAG ACGTGCTAAT TTTAAGGTTA AATTTGGACG AGAAGAGTTC AGAGGATATC 
GTATGGGGTC AAATAAAGAG AAGTGTAAAC AAAATAGAGA GAGCACTAAA ACAATATGGT 
TTTAGAGTAA TCGATGTACA AGCATGGGGA GATACCAATA ATATCACTAT TGCAGTACAA 
CTGGAAAGTA AGAACATTGG ACAGTATTAT CTAAATATTG GACCACAATA CTACTCAGGA 
ACTATAGAAG ATTTTATTCA GAAAAATGAT AATATATGGG TTGGAGAAGA TGGAAGATTA 
TACTCTATAA AAGAGAGAAA GGAATACGAT GCAGAGACAA TAGCCAAAAA GAATATAGTT 
CTAAAGGTGA AGTACAATAT CGAGAGTTAT TGGCTACAAA ACACGGAAGA TCAACAAATA 
ATGAAATTCT TGAGGAAAAC TCCAACTTGG TTAAAATAA

Protein sequence

MIEEEVLKII KPTEEDKKGI EKVLEIIRER LNKLDFEVEG SFRKGTWLRQ DTDIDVFVFY 
PKDVGKEYLE RNALNDIINR IKDLDYTLAY AEHPYVIVNI NNVEVDIVPA LRVESGDKAI 
TAVDRTPFHT KYVTSHLDER GKDEVRLLKR FMKGIGVYGA ELKVQGFSGY ATELLIIYYG 
NFRKVLEEAS KWKHPIKIEL TKPMKIFSEP LIIPDPVDPK RNVTAAVSLK NIATFSIAAK 
YYLKNPSIEF FFPSKKVEEK VKGDVLILRL NLDEKSSEDI VWGQIKRSVN KIERALKQYG 
FRVIDVQAWG DTNNITIAVQ LESKNIGQYY LNIGPQYYSG TIEDFIQKND NIWVGEDGRL 
YSIKERKEYD AETIAKKNIV LKVKYNIESY WLQNTEDQQI MKFLRKTPTW LK