Gene Ssol_1234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1234
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1150083
End bp	1151414
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	31%
IMG OID
Product	domain of unknown function DUF1743
Protein accession	ACX91472
Protein GI	261601869
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.640745
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATATG TAATAGGGAT TGACGACCAC GATTCCTACA AGTTTGGATG CACTACACAT 
TTTTCTGTAA TTCTAACCTC CTATTTATAT AAAAATCATA GTACTATTTT ATTAGACTTA 
CCTTACCTAG TTAGATTAAA CCCCAATATA CCTTGGAAGA CAAGAGGCAA TGCGAGCATA 
AAACTTATTG TTGAGTTTAA TGGAACAAAA AAAGAACTAG CAGATATAAT TTTTTCATAT 
TCTATTGAAT ACGTTAAAGA TGTTTCACTA GCACTAGAGC ATGGAAGAAA ACCTGGAATA 
GCAATTATGG AATATGATAA ATATATCACT TTATTCGACA AATTATACGA TTTCTATATT 
AAGGGAATAT CAGATATCAT TCCTATTGAC TATGCGAAAA AATTCGCTGA GAAAAACGAT 
ATAGAACTTA GAGGAGATAG AGGTATTATT GGAAGTATTG CTGGGCTAGG AATGAGTGGG 
GATTACACAT ATGAATTAAT TACTTACAGG AAAAAAGAAA ATTGGCTCAA AAAGAGAATG 
ATAAATAAAG ATTCAGTAAA GAGGGTTGAT GAATCAACGT TTCCGTTAAC ATTTGCAAAT 
TACGATTACA TAAATGACAC TCCCCTTATA ACTCCACATG GAACTGATCC AATCCTATAT 
GGAATTAGAG GAGCCTCCAT ACAACATCTA ATTAAGGCTA TGGAACTAAT AGAGTCAAAT 
GAGGATATTG ATTTCTTTGC CATTTTTAAG ACCAATCAAA GTACTGATAT TCACTTCCAA 
AAAATCGGTA ACCGTTTCTA CCAGGAAACT AAGAAAGTTG TACAAGTAAA AAATGTAAGG 
ATACTTGAAG GTGGAGATGT AATAGTTGAA ACTACTGATA ATGACATATT ATTTGTGTAT 
AAAGAAACTG GGGAGTTAAA TAGTGCAGCT AAATTATTAA AAAAGGGTGA CGAAATAGTA 
GCTTATGGAG CCGTAAAACC ATCCATAGCT TATGGAAAGA TCATAGAGCT GGAGAGGTTT 
GAAATATTAA AATTATACGA TTTAGAGTTA GTCAATCCCA AATGTCCCAG ATGTGGCGGA 
TCTACAAACT CTCTAGGAAA AAATAAGGGA TATAGATGTA AAAAGTGTAA ATATATTATA 
AATACAACTA ATAAGAGTAC AAAAAATATA ATGAGAAACT TATCATTAGG AATGTACCAA 
ACTAGATCTT ACAGACATCT TACTAAGCCT ATATTCTTAG AACTAGAAAA CAATAAACCA 
AGTTTTTATG AGGAGAGAAA GTTCCTAGAG ATGTATAGAT CAACATTATA TAAGCTTGAT 
TATCATCTAT AG

Protein sequence

MKYVIGIDDH DSYKFGCTTH FSVILTSYLY KNHSTILLDL PYLVRLNPNI PWKTRGNASI 
KLIVEFNGTK KELADIIFSY SIEYVKDVSL ALEHGRKPGI AIMEYDKYIT LFDKLYDFYI 
KGISDIIPID YAKKFAEKND IELRGDRGII GSIAGLGMSG DYTYELITYR KKENWLKKRM 
INKDSVKRVD ESTFPLTFAN YDYINDTPLI TPHGTDPILY GIRGASIQHL IKAMELIESN 
EDIDFFAIFK TNQSTDIHFQ KIGNRFYQET KKVVQVKNVR ILEGGDVIVE TTDNDILFVY 
KETGELNSAA KLLKKGDEIV AYGAVKPSIA YGKIIELERF EILKLYDLEL VNPKCPRCGG 
STNSLGKNKG YRCKKCKYII NTTNKSTKNI MRNLSLGMYQ TRSYRHLTKP IFLELENNKP 
SFYEERKFLE MYRSTLYKLD YHL