Gene Ssol_0847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0847
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	790751
End bp	792154
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	37%
IMG OID
Product	Carboxypeptidase Taq
Protein accession	ACX91095
Protein GI	261601492
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.202747
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATGAAG ACATTTGGGC AATTGAACAC GCAATAAGCT TACTGGATTG GGATATCCAA 
ACTTACATGC CCCAATCTGG GATTAAGGCT AGGGGAGAGG CTTTAGCCAG GCTAAGTAAC 
TTAAGGAGGA AATTGTTGTT AGGCATTAGA GGCGAGATAG AAAAGTTAGA GCCAAAAAAT 
GATATTGAAA AGGGTTTAAA AAGAGTTTTA GAAAGAGAAT ATAAGTACTA TGACGCTGTG 
CCAGAAGAGT TGGATATGAA ACTTCATAGA ATAACATCTG AAGCTACTGT AGTTTGGAGA 
AACGCTAAAG CTAAAGGCGA TTTTAACGCA TTCAAACCTT ATTTAGAGCA AATACTTGAG 
ATTAAGAGAG AGATAGCACA TAAGCTAGGG TATAAGGATC ATCCATATAG TGCACTTTTA 
GATAGGTATG AAGAAGGGTT TACTGTCACC GATGCTGAAA GGGTATTCAA CGAGTTATTA 
CCCGGTTTGT CTAAGATTCT CAATAAGATC GATGATAAGT TTACTAGAAA ATATCATTTT 
GAGGATGAAA AATATGATGT TTTTCAGATG AGTAAAACCA TAGAGGCAAT AGCTTATGAG 
GTACTAAAGA TGCCTAAGGA TAGATTTAGA ATAGACGTTT CTCCTCATCC TTTCACAGTA 
TCAATGAGTA GAAATGATGT TAGAATAACA GTAAGGTATG AAGGATATGA TTTCAAGAGA 
GTTCTTTATT CTCTAGTGCA CGAGAGCGGG CATGCAATAT ATGAGTTACA AATAGATCCG 
AGTCTAGAAT ACTCTCCTTT AGCAAATGCT CCTTCCATGG GCCTTCATGA GTCGCAATCG 
AGATTCTGGG AAAACGTAGT AGGAAGGAGT TATGGCTTTA TTAAAACCAT TTATCCCTTG 
CTAAACGTTA AGGATAGCAT TGATGATGTA TATTACTATG TTAATGGCGT TAAGAGGCAA 
CCAATTAGGG TTGACGCTGA TGAAGTTACT TATAACTTTC ATATTGCAAT CAGATACGAG 
ATAGAGAAGA GGGCAATAGA GGGTAGTTTA GAAGCTAGCG AATTCCCCTC ACTATTTAAT 
GATTTGATGG ACAAATACCT AAATATAAGG CCTAAGAATG ATGGAGAGGG AGTATTACAA 
GACGTTCATT GGAGTCAAGG CTCTTTTGGT TACTTCCCTA CTTATACATT GGGAAATGTG 
ATAGCTGGTA TGGTATACTA CCATATGAAG AGTGAGAGAG GTTTCGATAT TAGTAATATA 
GAGGGGATAA AGAATTGGCT AAGAGAGAGA ATTCATAAAT ACGGATCAAT ATATTCACCA 
AAGGAGTTAC AAATGAGGTC ATTTGGTGAG GCATATAACC CATCTAGGCT ATTAGATTAT 
ATGAGAGAGA AATATAATGC GTGA

Protein sequence

MYEDIWAIEH AISLLDWDIQ TYMPQSGIKA RGEALARLSN LRRKLLLGIR GEIEKLEPKN 
DIEKGLKRVL EREYKYYDAV PEELDMKLHR ITSEATVVWR NAKAKGDFNA FKPYLEQILE 
IKREIAHKLG YKDHPYSALL DRYEEGFTVT DAERVFNELL PGLSKILNKI DDKFTRKYHF 
EDEKYDVFQM SKTIEAIAYE VLKMPKDRFR IDVSPHPFTV SMSRNDVRIT VRYEGYDFKR 
VLYSLVHESG HAIYELQIDP SLEYSPLANA PSMGLHESQS RFWENVVGRS YGFIKTIYPL 
LNVKDSIDDV YYYVNGVKRQ PIRVDADEVT YNFHIAIRYE IEKRAIEGSL EASEFPSLFN 
DLMDKYLNIR PKNDGEGVLQ DVHWSQGSFG YFPTYTLGNV IAGMVYYHMK SERGFDISNI 
EGIKNWLRER IHKYGSIYSP KELQMRSFGE AYNPSRLLDY MREKYNA