Gene Ssol_1071 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1071
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1002919
End bp	1004118
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	32%
IMG OID
Product	metal dependent phosphohydrolase
Protein accession	ACX91314
Protein GI	261601711
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0173536
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAAAG TTTATGATGA GATCCATGCG TATATTGAAC TTGACGATAG AGAGGCCAAG 
ATAATTGATA TGCCAGAATT TCAGCGCCTA CGAAGAATAA AACAAACAAG TTTAGCATAT 
CTGGTATACC CTGGGGCTAC TCATACCAGG TTCAGTCACT CTTTAGGGAC ATTTTATCTT 
ACTACAATTT TAGGTGAGAA ATTTAGACAG CTAGGAATAA TAACTGACGA AGAGTCAACT 
TACCTAAAAT TATCTGCACT GCTCCATGAT ATAGGTCAAT TTCCTTTTAG TCATAGCCTA 
GAGCCTTTAT ATTTAGAAAA GGGATTATCA AATAAGGATT TAAGGTATAT GATAATTTCC 
AAATCGCCTA ATTTTAGGGA ATTTTTTGAT AATGAATCAA TTGACTATAG TAAGATTATA 
GAAATTTTGA ACGGAAACTC AATGATGTCA TCTATAGTAA ATAGTGACGT AGATGTTGAT 
AGGATGGACT ATCTGGTAAG GGACTCTAGA CATACTGGAG TGCAACTAGG CAATATTGAT 
TTATATAGAT TATTGGATAC CATCTTCTAT GGAAATAATA ACGAAATTGT TGTTCAAGAT 
AAAGGTATAT ATAGTTTAGA GAACTTTTTC ATATCCAGGC TTCACATGTA TCAAGCTGTA 
TATTATCATA AGACCATAAT AGGTTATGAA CTGATGCTGA GAGAAATTTT CAGAACTATT 
TACGATTGCT GTGATTCGTC AATCTTAAGC GTAGAAAATA TAAGAGGTCT TGTCTATGAT 
TCCTCAATAT CCTATTGGGA TGATGAATGG GTTTTCATGA TTCTTTACAC ATATCTCTAT 
TCCTCTAACT CTCCCCTTTA TTTAAAGCAG AAAATAAGAA ATTTCTTGGA TAGAAGAGGT 
CCTAAAGTGG TTTATGAAGA GATTTCCTAC GATAACGAGA TGAAAGGAGG AGATATTAAA 
ATTAAGGAGA TAGTAGATCG TTTAGAGAGA AATCAGATTC CGAGGAGTTC AATATATCCC 
ATTGAGGAAA AAATAAAAAT ACTGAATAAG GATAAAATAA ATATAATTTC AAAGAATAAT 
GAGATGAATA TAATCCGGTA TAAGTCCACT TTAATTAACC ATATACCAGA GACTTTAACT 
ATAAGAAGAA TTTATGTAGA TCATGAATAC GCTAAAAAAG CTAGAGATGT AGTTCCATGA

Protein sequence

MKKVYDEIHA YIELDDREAK IIDMPEFQRL RRIKQTSLAY LVYPGATHTR FSHSLGTFYL 
TTILGEKFRQ LGIITDEEST YLKLSALLHD IGQFPFSHSL EPLYLEKGLS NKDLRYMIIS 
KSPNFREFFD NESIDYSKII EILNGNSMMS SIVNSDVDVD RMDYLVRDSR HTGVQLGNID 
LYRLLDTIFY GNNNEIVVQD KGIYSLENFF ISRLHMYQAV YYHKTIIGYE LMLREIFRTI 
YDCCDSSILS VENIRGLVYD SSISYWDDEW VFMILYTYLY SSNSPLYLKQ KIRNFLDRRG 
PKVVYEEISY DNEMKGGDIK IKEIVDRLER NQIPRSSIYP IEEKIKILNK DKINIISKNN 
EMNIIRYKST LINHIPETLT IRRIYVDHEY AKKARDVVP