Gene Ssol_1656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1656
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1491756
End bp	1492886
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	33%
IMG OID
Product	histidinol-phosphate aminotransferase
Protein accession	ACX91873
Protein GI	261602270
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.532506
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATTTT CATTAAAGCT TATTTATTTA TTTTACGTTG CTTATCTAGG GTTTTATATT 
GCACCAACCA AGTTAGTTAG AAATAAGATA AAATCTTGGC TATTAAATGC AAGCGAATAT 
GATTTTACAG ATATAAAAGA AGGAATAAGA TTACATCTTA ATGAATCCCC ATTTGAGCCT 
CCACAATTTA TAATAGATGC GGTTAAGATG TATTTAAGTA AGGGAAACAG ATATCAACAT 
CCAGATCTTT TAGAAAAATA TAGGGAATTG GCTGCTGAAT ATTCGAAGGT GGAACCAGAA 
AACATTTATC CATCTGTAGG TGCGGATGGG TCAATCAGAG CAATATTTTA TAACCTTGTA 
GAGCCGGGTG ATACAATACT AACGAATTAC CCGTCTTATA GTATGTATTC TGTTTACTCT 
TCAGTAAGAG GAACTAAGGT AATTAAAGTA AATCTTAAAG AGGATAATGA ATGGTGGAAA 
GAAAACACTG ATGATTTACT TGCTCAAGCA GAAAAAGTTG AGTTAGTCAT AATTGATGAT 
CCTAATAATC CTACAGGATC GCCAATGCTA AATGGGAAAA AGGAACTAAT AGGTCAATTA 
GCAGAAAACA CAAAAGGGTT TGTTGTAATT GATGAGGCAT ACTACGAATT TGGAGGATAT 
ACAGTTTCAC CTTATATTTA CGACTATCCT AACGTTTTGG TGGTTAGGAC TCTGAGTAAG 
GCATTTTCAT TAGCTTCCTA TAGATTAGGT TATACGATAG CTAATGAGGA GATAGTAAAG 
GCTCTTATGA AATCATCAAC ACCTTTTGAT ATACCTTTAC CTTCACTCAT TGCCGGAATT 
ACAGCATTAG AAAACCCGTC ATATATAAAA GATGTCGTAA ACATAGTTAA TAGGAATAGG 
GAAATATTAT ATCAAGGGCT TAAGAATCTA AATCTGAAAG TTTACAAGTC GATAACCAAT 
TTCCTTTTAA TAAAAGATAA CAGAAACTTG CAGGAAATGC TTATGAGACA CGGGATTGCA 
ATAAGAAAGT TATATGACAA CTTTTATAGA ATAACAATAG GGACTGAAGA TCAGTGCAAG 
ATGGTTATAG ATAAACTTGG TGAGGAACTT GAAAATAGCA ATTCCAAATA A

Protein sequence

MRFSLKLIYL FYVAYLGFYI APTKLVRNKI KSWLLNASEY DFTDIKEGIR LHLNESPFEP 
PQFIIDAVKM YLSKGNRYQH PDLLEKYREL AAEYSKVEPE NIYPSVGADG SIRAIFYNLV 
EPGDTILTNY PSYSMYSVYS SVRGTKVIKV NLKEDNEWWK ENTDDLLAQA EKVELVIIDD 
PNNPTGSPML NGKKELIGQL AENTKGFVVI DEAYYEFGGY TVSPYIYDYP NVLVVRTLSK 
AFSLASYRLG YTIANEEIVK ALMKSSTPFD IPLPSLIAGI TALENPSYIK DVVNIVNRNR 
EILYQGLKNL NLKVYKSITN FLLIKDNRNL QEMLMRHGIA IRKLYDNFYR ITIGTEDQCK 
MVIDKLGEEL ENSNSK