Gene Ssol_0419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0419
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	377376
End bp	378617
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	35%
IMG OID
Product	glycosyl transferase group 1
Protein accession	ACX90702
Protein GI	261601099
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.102155
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGAGA AATACGTGGA ATTTATAGGA GAGCATGAGC TTGACGCTAT CTTTAAGATA 
GCGGAGAAAA TTAAGGATTT ATCAATACTT CATGTAAACT CTACTAAGGC TGGAGGTGGA 
GTAGCTGAGA TATTAAATAG AATGCTACCA TTAATGAAAG AGTTAGGTCT TAATGTTGAT 
TGGAAGGTTA TAAAAGGAGA TAATGAGTTC TTTAACGTAA CCAAATCCTT TCACAATTCA 
TTACAAAATG GAACTGGAAA TATACCAGAT GAATACTTTA AAATATATGA TAAATGGCAA 
GAGATAAACT TGTCTGAAAT TCCGTTAGAT TACGATATAA TGTTTATACA TGATCCCCAA 
CCGGCGGGGC TTATAAAATT CAAAAAAGGT AATAGTAATA AGTGGATTTG GCGATGTCAC 
ATTGACATTT CAAATCCATA TCCACCAGTG TGGAACTTCT TACGGAAGTA TATCTCCAAA 
TATGATAGTA TGATAATCTC TGTTCCCTCG TTTGGGAGAG ATGATATCGA AATTCCGCAA 
TTCGTAATAC CACCATCAAT AGATCCATTA AGTATAAAGA ATAGGGATAT GTCTGAGACT 
ACTATATTGA GAATATTATA TAAGTTTGGT ATTAATCTTG AAAAGCCATT AATAACTCAA 
GTGTCCAGAT TTGATTACGC TAAAGATCCT TTAGGTGTCA TACAGGCTTA TAAGTTAGCG 
AAAAGGCATG TTGACATACA ATTATTATAT GTAGGAAGCC CAGCCACCGA TGATCCAGAA 
GGTGAGAAGG TTTATAGTGA AGTAGTTAAG GCCTCTGAAG GAGATAAGGA TATACATTTA 
CTAATGTTAC CGCCTTATAG TGATTTGGAA ATAAATGTAT TTCAAACAGC ATCAACGGTA 
GTTATGCAGA AGTCTATAAA GGAAGGCTTT GGACTTACTG TTAGTGAGGC CATGTGGAAG 
AGAAAACCAG TAATAGGTGG AAACACTGGA GGAATTCCCT TACAAGTGAT AAATGGAATT 
ACTGGATTCT TAGTTAATAG CCCACAAGGC GCATCGCATT ACATAATATA CTTAATTAGG 
AATGAGGAGA TAAGGAGGAG ACTTGGTACT AATGCCAGAG AACACATAAG GAGAAATTTC 
CTCATAACTA GAGAACTCAG GGACTACCTA ATGACAATAG TCTATGTAGC TAATAGGGGT 
TTGGCTTCAT TGAATTCTCA TGAATCTATA TCTAATCATT AG

Protein sequence

MIEKYVEFIG EHELDAIFKI AEKIKDLSIL HVNSTKAGGG VAEILNRMLP LMKELGLNVD 
WKVIKGDNEF FNVTKSFHNS LQNGTGNIPD EYFKIYDKWQ EINLSEIPLD YDIMFIHDPQ 
PAGLIKFKKG NSNKWIWRCH IDISNPYPPV WNFLRKYISK YDSMIISVPS FGRDDIEIPQ 
FVIPPSIDPL SIKNRDMSET TILRILYKFG INLEKPLITQ VSRFDYAKDP LGVIQAYKLA 
KRHVDIQLLY VGSPATDDPE GEKVYSEVVK ASEGDKDIHL LMLPPYSDLE INVFQTASTV 
VMQKSIKEGF GLTVSEAMWK RKPVIGGNTG GIPLQVINGI TGFLVNSPQG ASHYIIYLIR 
NEEIRRRLGT NAREHIRRNF LITRELRDYL MTIVYVANRG LASLNSHESI SNH