Gene Ssol_1870 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1870
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1662127
End bp	1663404
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	38%
IMG OID
Product	pyridoxal-phosphate dependent TrpB-like enzyme
Protein accession	ACX92082
Protein GI	261602479
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTAAAAG AAGACGAGAT TTTGCCTAAA TATTGGTACA ATATAATCCC TGATCTACCT 
AAACCCTTGC CTCCACCAAG GGATCCACAA GGTGCCTATT TCTCGAGAAT CGATTTATTA 
AGAAGTATAC TACCCAAGGA GGTATTAAGA CAACAATTCA CAATAGAAAG GTATATAAAG 
ATCCCTGAGG AAGTAAGAGA TAGATATTTA TCGATAGGAA GACCAACTCC ATTATTTAGG 
GCTAAAAGGT TAGAAGAGTA CTTAAAGACA CCAGCAAGAA TTTACTTTAA ATATGAAGGT 
GCTACACCTA CTGGATCTCA TAAGATAAAT ACAGCAATTC CTCAAGCGTA TTTTGCAAAA 
GAAGAGGGAA TTGAACACGT AGTTACTGAA ACTGGAGCTG GTCAATGGGG AACTGCAGTC 
GCACTTGCAG CTAGTATGTA TAATATGAAA AGTACTATAT TCATGGTAAA GGTAAGTTAT 
GAACAAAAAC CGATGAGAAG GAGTATAATG CAATTATATG GGGCTAATGT TTACGCAAGC 
CCCACAAACT TAACTGAATA CGGTAGGAAG ATATTAGAGA CAAACCCACA GCATCCAGGA 
TCATTAGGTA TAGCAATGAG CGAGGCAATA GAGTATGCTC TTAAGAACGA ATTTAGATAT 
TTAGTAGGTA GCGTTTTAGA TGTAGTACTT TTGCATCAGA GTGTTATTGG TCAAGAGACT 
ATTACTCAAT TGGATTTGTT AGGAGAAGAC GCTGATATCC TAATTGGATG TGTAGGAGGT 
GGGAGCAATT TTGGCGGTTT CACATACCCC TTTATCGGAA ATAAGAAAGG CAAGCGTTAT 
ATTGCAGTAA GTTCTGCAGA AATTCCAAAG TTTAGTAAAG GTGAATATAA ATACGATTTT 
CCAGACTCTG CTGGATTATT ACCTTTAGTG AAAATGATAA CTTTAGGTAA AGATTACGTT 
CCGCCACCAA TATACGCAGG CGGGTTAAGA TATCATGGTG TAGCACCAAC ATTAAGTTTG 
TTAACAAAGG AGGGTATTGT GGAATGGAGA GAATACAATG AAAGGGAGAT TTTCGAAGCT 
GCTAAGATAT TTATCGAGAA CCAAGGTATT GTACCAGCCC CAGAATCAGC TCATGCAATA 
AGGGCAGTAG TTGATGAAGC TATAGAGGCA AGAAAGAATA ATGAGCGAAA GGTCATCGTC 
TTTAATCTAA GTGGACATGG ATTGTTAGAT CTGTCAAATT ACGAATCCAT GATGAAAAGG 
TTGAATGGAA ATGGGTAA

Protein sequence

MVKEDEILPK YWYNIIPDLP KPLPPPRDPQ GAYFSRIDLL RSILPKEVLR QQFTIERYIK 
IPEEVRDRYL SIGRPTPLFR AKRLEEYLKT PARIYFKYEG ATPTGSHKIN TAIPQAYFAK 
EEGIEHVVTE TGAGQWGTAV ALAASMYNMK STIFMVKVSY EQKPMRRSIM QLYGANVYAS 
PTNLTEYGRK ILETNPQHPG SLGIAMSEAI EYALKNEFRY LVGSVLDVVL LHQSVIGQET 
ITQLDLLGED ADILIGCVGG GSNFGGFTYP FIGNKKGKRY IAVSSAEIPK FSKGEYKYDF 
PDSAGLLPLV KMITLGKDYV PPPIYAGGLR YHGVAPTLSL LTKEGIVEWR EYNEREIFEA 
AKIFIENQGI VPAPESAHAI RAVVDEAIEA RKNNERKVIV FNLSGHGLLD LSNYESMMKR 
LNGNG