Gene Ssol_1224 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1224
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1141619
End bp	1142836
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	34%
IMG OID
Product	threonine dehydratase
Protein accession	ACX91462
Protein GI	261601859
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTACT TAGAATATTT TGATAGAATT AGACTAGCAA AAGAGAAAAT AGAAAAATAT 
GTGCATATTA CTCCAATAGA TTATTCTACA ACGTTTTCCA GAATTATAAA CGCAAAAGTT 
TATCTTAAGT TGGAAAATCT ACAGAAAACT GGATCATTCA AAGTTAGAGG TGCCTTTAAT 
AAGTTATTAT CTTTAAAGGA GGAAGAAAAA AAGAATGGCG TTATTGCAGT TTCAGCAGGT 
AATCATGCTC AAGGAGTTGC TTATGCAGCC TCCACGTTAA ATATCAAATC GACTATAGTG 
ATGCCAGAAA CAGCTCCAGC TTCCAAGTAT TTAGCTACAA AATCCTATGG GGCAGAAGTA 
GTTCTTTATG GTAAGTACTT GCATGAGAGT ATGAAGAAAG CGGAAGAATT GATTCAAAAT 
ACTGGTTTAA TATTTGTTCA TCCTTATAGT GATTTAGATG TGATAACGGG TCAAGGTACC 
ATAGGATTAG AATTGTATGA TATCGAACCA GATTACGTAA TTATTCCAAT AGGGGGTGGA 
GGATTGATTT CTGGTATAAG TATAGCTTTA AAGTATAGAT TCCCAAACGT CAAGATAATA 
GGCGTTCAGT CTTCTTCTTC TCCTTCAATG AAGGTTTCTA AGGATCTTGG GAGGCTTGTA 
GAAATAGAGC CTAGTTATTC CATAGCTGAT GGCATATTGG TTAAGTCTCC TTCTGAATTA 
ACCTTTAGTA TAATTAATGA GTTAGTAGAT GATATAGTAT TAGTGGATGA TGAAGAAATA 
GCTGAGGCAA TAGTTTTACT ACTTGAAAGA AGTAAAACGC TAGCAGAAGG AGCAGGAGCT 
GCAGCATTAG CGTCACTAAT TTCAGGGAAG GTTAAAGTAA ATGGAATAGA CAAAAAAGTA 
ATTTCATTAG TAAGTGGGGG AAATATTGAC TTATCATTAT TGTCTACTCT AACAGAGAAG 
TTTTTATATA GACAAAAAAG GGTAGTCAAA GTGAGGGTAA TAGTTCCAGA TAAGCCAGGA 
CAGTTAAATA AAGTATTAAG CTATGTAGTT AAGATCAGAG GTAATATAAT AGATATTGTT 
CATGATAGGC ACAGTAGTGA TGTATTGCCT GGATACACTA AAATATATAT AACTTTCGAG 
CTTCAGTCTT CAGAGGCTAT TACCTTACTT CTGACAAATC TGGCAAACGA GGGAATAGAC 
GTGAAAATTG TAGAATAG

Protein sequence

MNYLEYFDRI RLAKEKIEKY VHITPIDYST TFSRIINAKV YLKLENLQKT GSFKVRGAFN 
KLLSLKEEEK KNGVIAVSAG NHAQGVAYAA STLNIKSTIV MPETAPASKY LATKSYGAEV 
VLYGKYLHES MKKAEELIQN TGLIFVHPYS DLDVITGQGT IGLELYDIEP DYVIIPIGGG 
GLISGISIAL KYRFPNVKII GVQSSSSPSM KVSKDLGRLV EIEPSYSIAD GILVKSPSEL 
TFSIINELVD DIVLVDDEEI AEAIVLLLER SKTLAEGAGA AALASLISGK VKVNGIDKKV 
ISLVSGGNID LSLLSTLTEK FLYRQKRVVK VRVIVPDKPG QLNKVLSYVV KIRGNIIDIV 
HDRHSSDVLP GYTKIYITFE LQSSEAITLL LTNLANEGID VKIVE