Gene Ssol_0222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0222
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	188303
End bp	189799
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	36%
IMG OID
Product	dihydropteroate synthase-related protein
Protein accession	ACX90518
Protein GI	261600915
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.70107
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAAGTAT TAGTAGTAAC TGGAACTTTA GCTGCACCAA TACTTTCTGA AGTTGCTAAA 
AACATTAAAG ATACTAAAGT TGAGATTAAG GTACTTAATT ACCCTGTTGC CTCATTAATG 
AGTACAAAGT TTATAGCAGA AAACTTGAAG CAGACCAAAT TTGATGCAGA TTACATCCTT 
TTACCAGGTT TAGTCTATGG CGACGCCAAA ATTGTTGAGG AAGTTACGGG AGTGAGAACT 
TTTAAAGGGA CAGAGGAAGC ATGGGATCTC CCTAGAGTAA TTGAGGCATT GAAAAATGGG 
ATACAACTCT CCACAACGGA ATCTGCTGAT AAGATCATAG GTAAAATGGA TAATATTGAA 
GAGAAGCTAA GAAAAATGGA GGAAGAAGCT AAGATTTCGT TTGAAATAAA TGGAATTAAG 
ATTACAACTT ATCCACCGCC ATTTAGAATT TTCTTGGAAA TAGACAATAA GCAAGAATTC 
GAGAAATTGG ATAGAATAAG AAAAAACGTT GACGTAGTAG TATTAGGTTT TCCAGTGGGT 
CACTACGATT TGGACGAGGT TAAAAATAAG GTTAAACAAT TAGTGGACTA CGGTTACGTT 
GTTGGAATAG ATGCTGAATC GCCCAGAGAA TTAAAAGAAG GTGTAAGAGC TGGAGCTTCA 
TTCGTATTTA ACCTAAATGA AAATAACTTT GAGGAACTTG AGGAAATTAG GAAAGAAGCA 
GCATTTGTTG TAGCCCCGTT TAACACTGAA AATAGAGGAG AAATAACTAT TGATCTCGTA 
AAAAAAGCCA AACAAAAAGG ATTCGATAAA TTAATAGCAG ATCCCGTATT ATCGCCTCCC 
CTAAGAGGGT TAGTAAGCAG TATAATTGGG TATAAGTACG TCAGAGAGAC GTTGCAAGAT 
ATACCTATTC TAATGGGAAT TCTTAACGTG ACTGAACTCA TTGATGCAGA TAGTATAGGA 
ATGAATGCAC TACTAACCGC AATTGCTGGA GAGTTGGGAA TTTCTAACTT ATTAATTATG 
GAAAAGGGGA AAACGAGGTG GAGTAGTTGG GAAGTATCAC AAGCTACAAA AATGATAAGT 
GTAGCTTTGA AGGAAAATAG ACTTCCCAAA GATATAGGAA TAGATTTGTT AGTACTTAAG 
GATAAGAGAA GATTTAGGGA GAGTTTTAAC GCTGACGTGA TTGTTAATAG GCGTATAGAG 
CCTGAAATGG ATAATACCGG ATTTGCAAAA ATTTTCGTGA GTGAAGATGG ATTTGGAGTA 
GAATGGATTG GGAAAAACAA GATAACAATA AAAGGAAAAG ATGGGCTAAG CATTGGCAGA 
GAGCTGATTA GGAGAGTTAA GGATATTAGC AAAGAGCATG CCGTGTATAT AGGATATGAG 
TTGGCCAAGG CTGAGATTGC GTATCAACTT GATAAAAATT ATATTCAAGA CAAGCCATTG 
TTCAAAAAGA TAATTAATGA TAATCTCCAT ACCGAGCACG ATAAGAAAAG AGGTTAA

Protein sequence

MKVLVVTGTL AAPILSEVAK NIKDTKVEIK VLNYPVASLM STKFIAENLK QTKFDADYIL 
LPGLVYGDAK IVEEVTGVRT FKGTEEAWDL PRVIEALKNG IQLSTTESAD KIIGKMDNIE 
EKLRKMEEEA KISFEINGIK ITTYPPPFRI FLEIDNKQEF EKLDRIRKNV DVVVLGFPVG 
HYDLDEVKNK VKQLVDYGYV VGIDAESPRE LKEGVRAGAS FVFNLNENNF EELEEIRKEA 
AFVVAPFNTE NRGEITIDLV KKAKQKGFDK LIADPVLSPP LRGLVSSIIG YKYVRETLQD 
IPILMGILNV TELIDADSIG MNALLTAIAG ELGISNLLIM EKGKTRWSSW EVSQATKMIS 
VALKENRLPK DIGIDLLVLK DKRRFRESFN ADVIVNRRIE PEMDNTGFAK IFVSEDGFGV 
EWIGKNKITI KGKDGLSIGR ELIRRVKDIS KEHAVYIGYE LAKAEIAYQL DKNYIQDKPL 
FKKIINDNLH TEHDKKRG