Gene Ssol_1233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1233
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1148357
End bp	1149550
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	35%
IMG OID
Product	orc1/cdc6 family replication initiation protein
Protein accession	ACX91471
Protein GI	261601868
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGATA TAATTGATGA GGTCATTTCT TCATTCAAGA CATCAAGCAT CTTCATAAAT 
AGGGAATATT TGTTGCCTGA TTATATCCCA GACGAGTTAC CACATAGAGA GGATCAGATA 
AGAAAGATTG CAAGTATTTT AGCTCCATTA TATAGGGAAG AGAAACCCAA CAATATTTTC 
ATATACGGTC TGACTGGGAC GGGAAAGACA GCCGTAGTGA AGTTTGTTTT ATCTAAATTA 
CATAAGAAAT TTCTTGGTAA ATTTAAACAT GTATATATTA ATACTAGACA GATAGATACG 
CCATATAGGG TATTGGCTGA TCTGTTGGAA TCACTAGATG TAAAGGTTCC ATTTACCGGG 
TTATCAATAG CCGAACTGTA TAGACGATTG GTAAAAGCAG TGAGAGACTA CGGTTCACAA 
GTCGTCATAG TTTTAGATGA GATTGATGCT TTCGTTAAAA AGTATAATGA TGATATTCTA 
TACAAATTAA GTAGGATTAA TAGTGAGGTG AACAAGAGTA AGATATCTTT TATAGGAATA 
ACTAATGATG TTAAGTTTGT AGATCTGTTA GATCCTAGAG TTAAAAGTAG TTTAAGTGAA 
GAGGAGATAA TTTTCCCCCC TTATAATGCG GAAGAGTTAG AAGATATTTT GACAAAGAGA 
GCACAAATGG CATTCAAGCC TGGAGTTTTA CCAGATAATG TAATTAAATT ATGTGCTGCA 
CTAGCTGCAC GAGAGCATGG TGACGCGCGT AGAGCCTTGG ATCTTTTAAG AGTTTCTGGT 
GAAATAGCTG AAAGAATGAA AGACACTAAG GTTAAAGAAG AGTATGTGTA TATGGCTAAG 
GAAGAAATAG AGAGAGATCG AGTAAGAGAT ATTATATTAA CTCTTCCTTT TCACTCTAAG 
TTAGTTCTTA TGGCAGTTGT TTCTATATCC TCCGAAGAAA ATGTAGTTTC AACTACTGGT 
GCTGTATATG AGACTTATCT GAACATTTGT AAGAAGTTAG GTGTAGAAGC TGTTACTCAA 
AGAAGAGTTA GTGATATTAT AAATGAATTA GATATGGTAG GGATACTAAC AGCCAAGGTT 
GTTAACCGGG GTAGATATGG CAAGACTAAG GAGATAGGTT TAGCTGTTGA TAAGAATATA 
ATTGTTAGAT CTTTAATAGA AAGCGATAGT AGGTTTGCTG ATCTCTGGAG TTGA

Protein sequence

MSDIIDEVIS SFKTSSIFIN REYLLPDYIP DELPHREDQI RKIASILAPL YREEKPNNIF 
IYGLTGTGKT AVVKFVLSKL HKKFLGKFKH VYINTRQIDT PYRVLADLLE SLDVKVPFTG 
LSIAELYRRL VKAVRDYGSQ VVIVLDEIDA FVKKYNDDIL YKLSRINSEV NKSKISFIGI 
TNDVKFVDLL DPRVKSSLSE EEIIFPPYNA EELEDILTKR AQMAFKPGVL PDNVIKLCAA 
LAAREHGDAR RALDLLRVSG EIAERMKDTK VKEEYVYMAK EEIERDRVRD IILTLPFHSK 
LVLMAVVSIS SEENVVSTTG AVYETYLNIC KKLGVEAVTQ RRVSDIINEL DMVGILTAKV 
VNRGRYGKTK EIGLAVDKNI IVRSLIESDS RFADLWS