Gene Ssol_1894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1894
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1683157
End bp	1684416
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	35%
IMG OID
Product	enolase
Protein accession	ACX92106
Protein GI	261602503
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTAACC GTTTTTCCAT AGAGAAGGTT AAGGGATTAG AAATCGTAGA TTCTAGAGGT 
AATCCCACTA TAAGAGTTTT CATAAGAACT AGTGATGGTG TCGAATCCTT TGGAGACGCA 
CCAGCAGGGG CTTCTAAAGG GACAAGAGAG GCGGTAGAAG TTAGGGATGA AAATGGGCTT 
ACAGTAAAGA GGGCAGTAGA CATTGTAAAT TACATAATAG ATCCTGCATT ACATGGAATT 
GATGTAAGAG AACAAGGGAT AATCGACAAA TTACTAAAAG ATATAGACTC CACTGAGAAT 
AAGTCTAAAT TAGGAGGAAA CACAATAATT GCAACATCAA TAGCTGCATT AAAGACTGCT 
TCTAAGGCCT TAGGTCTAGA GGTTTTTAAA TACATATCTG GGCCTAGATT ACCTAAAATC 
CCAATACCTT TACTTAATAT AATAAATGGC GGTTTACATG CTGGAAATAA GCTAAAAATA 
CAAGAATTCA TTATAGTGCC AATTAAGTTC AATACTTTTA AAGAAGCTCT TTTCGCTGCG 
ATAGACGTTT ATAGAACCCT AAAAGGGTTA ATAACGGAGA GGTATGGTAA AATTTACACA 
GCAGTTGGAG ATGAAGGGGG ATTCTCTCCA CCTTTAGAAG ATACTAGAGA GGCCTTGGAT 
CTAATATATA CTTCCATAAA TAATGCAGGT TATGAAGGAA AAATATATAT GGGAATGGAT 
GCTGCAGGGA GCGATTTCTA CGATAGTAAA AAAGAGAAAT ATATAATTGA TGGTAGAGAA 
TTGGATCCTA ATCAATTACT TGAATTTTAT CTTGACTTAG TTAAACAATA TCCCATAGTG 
TACTTGGAAG ATCCGTTTGA AGAGAACTCT TTTGATATGT TTAGCCAACT ACAAAATAAG 
CTGAGTTCAA CAATAATTAC TGGAGATGAC CTATATACTA CAAATATAAA ATATCTAAAA 
ATAGGTATAG AAAAGAGATC GACTAAGGGT GTTATAGTTA AGCCTAATCA AGTCGGTACA 
ATATCTGAGA CGTTTGAATT TACTAATTTG GCTAGGAGAA ACTCAATGAA GTTAATAACA 
AGTCATAGAA GTGGAGAGAC TGAGGACAAT TTCATAGCAG ACTTTGCGGT GGGAATTGAG 
TCAGATTTCA TAAAGGTTGG TGCACCGGCG AGAGGAGAGA GAACTAGCAA ATATAATAAG 
CTATTAGAAA TAGAAAATAA ATTTGGATTA GAATACGAAG GAAAATATTT TTATCTTTAA

Protein sequence

MINRFSIEKV KGLEIVDSRG NPTIRVFIRT SDGVESFGDA PAGASKGTRE AVEVRDENGL 
TVKRAVDIVN YIIDPALHGI DVREQGIIDK LLKDIDSTEN KSKLGGNTII ATSIAALKTA 
SKALGLEVFK YISGPRLPKI PIPLLNIING GLHAGNKLKI QEFIIVPIKF NTFKEALFAA 
IDVYRTLKGL ITERYGKIYT AVGDEGGFSP PLEDTREALD LIYTSINNAG YEGKIYMGMD 
AAGSDFYDSK KEKYIIDGRE LDPNQLLEFY LDLVKQYPIV YLEDPFEENS FDMFSQLQNK 
LSSTIITGDD LYTTNIKYLK IGIEKRSTKG VIVKPNQVGT ISETFEFTNL ARRNSMKLIT 
SHRSGETEDN FIADFAVGIE SDFIKVGAPA RGERTSKYNK LLEIENKFGL EYEGKYFYL