Gene Ssol_1863 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1863
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1654169
End bp	1655359
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	36%
IMG OID
Product	threonine synthase
Protein accession	ACX92075
Protein GI	261602472
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTGCT TGAATTGTGG ATATGAAACG GAAATAGATC AAAGTCAGAT ATTATGTCCA 
AGATGTGGAG GACTATTAGA AATTATACTA GAACCACCAA AGGACTTCTC TTTCAGTAAA 
TTGAGAGGAA GAGGAGTTTG GAGATATAAA GAATTAATAG CAGGCAGATA CAAAAATATT 
GTAAGCATAA ATGAGGGAAA TACCCCACTA ATTAGATCCT CAAATATAAA TGATAATCTT 
TATTTTAAAT TTGAAGGGCT TAATCCAACT GGTAGTTTTA AGGATAGAGG AATGACAGTG 
GCAGTTAGTT CTGCGGTAAG CTTGAATTAC AAAACTGTAA TAGCCGCATC CACTGGAAAT 
ACTGCAGCTT CTGCAGCTGC TTATGCTGCA AGAGCTGGTA TAAAGAGCTT TATCGTCTTA 
CCTAAAGGTA AGGTAGCATT AGGTAAATTA GCTCAATCAA TACTTTATGG CTCAGTTATT 
TTAGAAGTTG ATGGAAGTTT TGACGTTGCT ATGGATGCAG TAATGAGATT ATATAAGGAT 
TTAAAAGTAG TATATCCATT AAATTCCTTT AATCCATGGA GATTAGAAGG ACAAAAGACA 
ATCGCATTTG AGATAGCAGA AGAACTAGGA GTTCCTGACA ACGTGATAGT CCCGGTAGGC 
AATGCAGGCA ATATCTACGC CATATGGAAA GGATTTAATG AGCTAGTTAA AACTGGAGTT 
ATTAATACTA TTCCTAGAAT GATTGGAATC CAAGCTGAGG GCGCATCACC AATAGTTACC 
GCAATAATAA AAGGAAAAGA TTCTCCAGAT TTCATAGAAA ATCCAGATAC TGTAGCAACA 
GCAATAAGGA TAGGGAAACC AGTTAATTGG CAAAAAGCGA TGAAAGCAAT AAGGGAATCT 
AATGGAACCG CAATAGCTGT ATCTGATTCC GAGATATTAG ACGCACAGAA GACCCTAGCT 
AGAAAAGAGG GCATAGGAGC TGAGCCTGCT TCAGCAGCTG CCTTAGCTGG TTATATTAAG 
GCAATAAATG AAAAGGTGGT AGATAAAGAT GAAAAAACAG TTTTAATCCT AACAGGACAT 
TCGTTAAAGG ATCCCGATAG TATGACAAAA GCTGAGGCTA AAAGAATATT AGTTAATCCT 
TTACATATGG AAAAAATTAT CCTAGGTGAG ATAAATGGCT CTAATAGTTA A

Protein sequence

MKCLNCGYET EIDQSQILCP RCGGLLEIIL EPPKDFSFSK LRGRGVWRYK ELIAGRYKNI 
VSINEGNTPL IRSSNINDNL YFKFEGLNPT GSFKDRGMTV AVSSAVSLNY KTVIAASTGN 
TAASAAAYAA RAGIKSFIVL PKGKVALGKL AQSILYGSVI LEVDGSFDVA MDAVMRLYKD 
LKVVYPLNSF NPWRLEGQKT IAFEIAEELG VPDNVIVPVG NAGNIYAIWK GFNELVKTGV 
INTIPRMIGI QAEGASPIVT AIIKGKDSPD FIENPDTVAT AIRIGKPVNW QKAMKAIRES 
NGTAIAVSDS EILDAQKTLA RKEGIGAEPA SAAALAGYIK AINEKVVDKD EKTVLILTGH 
SLKDPDSMTK AEAKRILVNP LHMEKIILGE INGSNS