Gene Ssol_0197 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0197
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	170332
End bp	171612
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	31%
IMG OID
Product	glycosyl transferase family 2
Protein accession	ACX90493
Protein GI	261600890
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.823444
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAAGGG AAATTTTTGA AATTTTGCTT TTTATATCAT CATTTTTTAC ATCTTTATGG 
ATACTCCTTC AAGCATTCTA CTATAAAGTT TCTAATCAAA ACATTATACA ATTTTCTACT 
AAAAATGATA AAAATTCTAA CAAAAGAATA GACATAATCG TTGCAATAAA AGACGAAGAT 
GAAAAGACGA TTAAAGAACT AATTAATAAC CTATCGGGAT TGGACTATAG ATTTTACAAA 
GTTATTATAG TATCTGATGA TACAGAGGAG ACTTTTAAAA AAATTATAGA ATCACTAGAT 
AAACTTCCGG ACAATTTCGT AATTATAAGG AGACCAGAAA ACAAGGGAAG AAAAGCTGGA 
GCACTAAACT TCGCCACTAA TATTTCTGAT GCTGAAATGT TAGTGTATCT GGATGCAGAA 
GCCAGGGTCG AAAAGGACTT TTTACGTAAA ATTTCTCAAC TTGACTACGA TGCGGTTGCG 
TTTAGATTAA AAGTTAGAGA TGTTAATACA CAAGTTCAAA AGATATACTC ATATACCAAT 
GAATTTGTAA TGAACGCATT ATTCAAGGCT AGAGACAAGT TAGGTCTAAT AATATTTGCA 
AATGGTTCAG CATTCGGAAT AAAGAGAGAT ATTTTAAGGA AGATAGGTGG ATGGAAAGAA 
AATAGCGTAG CAGAAGACTT AGAGCTAGGT ATTAGACTTG CTCTGAGTAA TATTAAAGTA 
AAATACGTTG ATGACATCAC AGTTTATACC TTAGCTCCCT ATACCCATAC TGATTTATAT 
AACCAAATTA AAAGATGGGC TTATGGTTCT GGAGAATTGA TCTCTTACAG CATGAGATTG 
TTTAAATTAG GAATAAGGGG AATTGAGGGA TTTATATACT CACAACAGTG GGGAATTTAC 
CCCCTATACC TACTACTATT TCTTATTATT ATCTCAATAC AGTTTATATT AAATATAAAC 
TACTTTTATG TCTTTACCTC ACTAATCCCA ATACTAGTCT CGAATGGAAT TTACATAGCT 
CTGATAAAAC CTAAGGGAGA TTATAAAAGT GGCATTGTAA CCCTAATTGC TTCTCTTATC 
GGCTACATTC AAGGAATATT CAAAGTCAGG TTTAAATGGA AAGTTACACC CAAAAGCCTA 
GTTGGGAAAG AAGAAGAAAT CTTGAGTATA AAAATATTAG GGATTATTCT TGCGATAATG 
GCATATATTA ATAGTCTTTT CAATAACACA ATTTCATCTT TATTAATAAT TTTGTTTTCA 
CTTATTCTTT TAACTCTATA G

Protein sequence

MIREIFEILL FISSFFTSLW ILLQAFYYKV SNQNIIQFST KNDKNSNKRI DIIVAIKDED 
EKTIKELINN LSGLDYRFYK VIIVSDDTEE TFKKIIESLD KLPDNFVIIR RPENKGRKAG 
ALNFATNISD AEMLVYLDAE ARVEKDFLRK ISQLDYDAVA FRLKVRDVNT QVQKIYSYTN 
EFVMNALFKA RDKLGLIIFA NGSAFGIKRD ILRKIGGWKE NSVAEDLELG IRLALSNIKV 
KYVDDITVYT LAPYTHTDLY NQIKRWAYGS GELISYSMRL FKLGIRGIEG FIYSQQWGIY 
PLYLLLFLII ISIQFILNIN YFYVFTSLIP ILVSNGIYIA LIKPKGDYKS GIVTLIASLI 
GYIQGIFKVR FKWKVTPKSL VGKEEEILSI KILGIILAIM AYINSLFNNT ISSLLIILFS 
LILLTL