Gene Ssol_1643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1643
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1479832
End bp	1481550
Gene Length	1719 bp
Protein Length	572 aa
Translation table	11
GC content	41%
IMG OID
Product	acetolactate synthase, large subunit, biosynthetic type
Protein accession	ACX91860
Protein GI	261602257
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.169007
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCCAACAG GCGCACGCAT TTTAGTTGAT TCTCTAAAGA GAGAAGGAGT TAAGGTAGTA 
TTCGGAATAC CAGGATTATC GAATATGCAG ATATATGATG CTTTCGTAGA AGATTTGGCA 
AATGGTGAGC TTAGACATGT TCTAATGAGA CATGAACAAG CCGCAGCGCA TGCTGCAGAT 
GGATACGCAA GAGCTTCTGG AGTCCCAGGT GTATGCACAG CAACATCTGG TCCAGGTACG 
ACCAATTTAA CTACGGGGCT TATTACTGCA TACTGGGATA GTTCTCCTGT TATTGCAATA 
ACTGGTAACG TGCCTAGAAG CGTTATGGGT AAGATGGCAT TCCAAGAAGC TGATGCTATG 
GGAGTGTTCG AAAATGTGAC CAAATACGTT ATTGGTATTA AGAGGATAGA TGAGATACCC 
CAGTGGATTA AGAACGCATT TTATATAGCA ACTACTGGAA GACCTGGGCC AGTTGTGGTT 
GACATCCCTA GGGATATTTT CTATGAAAAA ATGGAAGAGA TAAAATGGCC AGAGAAACCA 
CTTGTTAAGG GTTATAGGGA TTTCCCAACT AGAATAGATC GTTTAGCACT GAAAAAGGCA 
GCTGAGATTC TAATCAATGC AGAGAGACCA ATAATTTTGG TAGGTACTGG AGTAGTATGG 
GCGAACGCGA CTCCAGAAGT TTTGGAGTTA GCAGAACTAT TGCATATTCC AATAGTCTCA 
ACTTTTCCTG GAAAAACTGC AATACCGCAT GATCATCCCT TATATTTCGG ACCAATGGGA 
TATTATGGAA GAGCTGAGGC ATCAATGGCT GCTCTAGAAT CTGATGCAAT GCTAGTAGTA 
GGTGCGAGAT TTAGCGATAG GACATTCACA TCATATGACG AAATGGTAGA GACCAGAAAG 
AAATTCATAA TGGTTAATAT AGATCCGACA GATGGAGAAA AGGCCATAAA AGTGGATGTA 
GGACTCTACG GTAACGCTAA GATAATATTA AGGGAGCTAA TAAAGGCAAT AATAACACTG 
GGCCAAAAAA GAGATAAAAG TGCATGGATA AAAAGAGTTA AAGAGTACAA GGAATATTAT 
TCCCAATTTT ACTACACTGA GGAGAACGGA AAATTAAAGC CTTGGAAGAT TATGAAAACA 
ATTAGGCAAT CATTACCAAG AGATGCTATA GTAACTACTG GTGTAGGTCA ACATCAAATG 
TGGGCAGAAG TGTTTTGGGA AGTATTGGAA CCCAGAACTT TTCTAACATC ATCTGGAATG 
GGTACAATGG GTTTTGGTCT CCCTGCTGCA ATGGGAGCCA AATTGGCTAG GCCTGATAAA 
ATCGTAGTGG ATCTAGATGG TGACGGTTCG TTCTTAATGA CTGGAACAAA TTTGGCCACG 
GCTGTAGATG AGCACATTCC AGTAATATCG GTGATATTTG ATAATAGAAC CTTAGGGTTA 
GTGAGGCAAG TTCAAGATTT ATTCTTCGGA AGGAGAATAG TAGGTGTAGA TTATGGTCCT 
TCGCCAGACT TCGTTAAATT GGCTGAAGCA TTCGGTGCTT TAGGCTTTAA TGCAACGACT 
TACGAGGAAA TAGAAAAGTC GATTAAAAGT GCAATAAAGG AAGACATCCC TGCAGTAATT 
AGAGTACCAG TAGATAAGGA AGAGCTGGCC TTACCTACGT TACCACCGGG TGGAAGATTA 
AAACAGGTGA TATTACGTGA CCCAAGAAAG AGTAGTTAG

Protein sequence

MPTGARILVD SLKREGVKVV FGIPGLSNMQ IYDAFVEDLA NGELRHVLMR HEQAAAHAAD 
GYARASGVPG VCTATSGPGT TNLTTGLITA YWDSSPVIAI TGNVPRSVMG KMAFQEADAM 
GVFENVTKYV IGIKRIDEIP QWIKNAFYIA TTGRPGPVVV DIPRDIFYEK MEEIKWPEKP 
LVKGYRDFPT RIDRLALKKA AEILINAERP IILVGTGVVW ANATPEVLEL AELLHIPIVS 
TFPGKTAIPH DHPLYFGPMG YYGRAEASMA ALESDAMLVV GARFSDRTFT SYDEMVETRK 
KFIMVNIDPT DGEKAIKVDV GLYGNAKIIL RELIKAIITL GQKRDKSAWI KRVKEYKEYY 
SQFYYTEENG KLKPWKIMKT IRQSLPRDAI VTTGVGQHQM WAEVFWEVLE PRTFLTSSGM 
GTMGFGLPAA MGAKLARPDK IVVDLDGDGS FLMTGTNLAT AVDEHIPVIS VIFDNRTLGL 
VRQVQDLFFG RRIVGVDYGP SPDFVKLAEA FGALGFNATT YEEIEKSIKS AIKEDIPAVI 
RVPVDKEELA LPTLPPGGRL KQVILRDPRK SS