Gene Ssol_2141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2141
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1926413
End bp	1928212
Gene Length	1800 bp
Protein Length	599 aa
Translation table	11
GC content	39%
IMG OID
Product	conserved hypothetical protein
Protein accession	ACX92344
Protein GI	261602741
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGCAA AGCATTTAAT TTCCTTAATA GTAATATTAA CTCCATTAGT TACTTTACTC 
ACTAGCGCCG TCTATACGTC TGGTGGTATA ACTTTTTACA GTCCAGCCTA TAACGGTGAG 
TCCTATTACA CTGGGCAATC AATAACCATT GACGCATTAC TACCGCAACA ATTTGCAACA 
GATGCAGCAA CCATAAACTT CTTTTTCCCC AATTCATCCT TAGCTGTGAC AATACCCGTT 
CAAATTAATG GAAGTGGTGG AATATACGTA CCTAATGCCT ATGCTTTCCC CAATGTTCCC 
GGGACATGGC AAATTACAAT AGAAGTTGCG GGCGGTGTGG CAGTAGGTAC CATTAACGTT 
AACGTTATTC AAAGAACTCC ATTAGTTACA GTACATCTGG GTTACGGTGT TGTCGGTCAA 
GCACTACCAC AAACGCCAAC CATAACCTTA ACTTTCCCTA ATGGTACAAC AATTACAGTT 
CCTCTTCAAG GTACAGTTAA CGTTCCTTCC GGTACTTCAT ATCAAGTTGA GCAAGCAATA 
ACTGAAAATA ATATCAGATG GGCTACCAAT TACACTAGTG GTACTATAAC CCCAGCGACT 
ACATCCATAA CGCCTACATA TTATCAACAA TATCTAGTTA CCTTTAATTA CACAGTCCAA 
GGAGGTACTG GCTACTCTCC ACCTACAGTT TACTATCGAA GTCTTGGAAT GAACGAAACA 
GCAAAAGCAC CAGCATCAGT TTGGGTAGAT GCCAATTCAG CTTATATTTA CTCGCCAGAA 
CTTCAATCTA ACGTCCAAGG AGAGAGATGG ATAGCGGTAA ACTTCACTGG GATCATTAAA 
GCTCCTGGCG AAATCAATGA ATATTATATT AACCAATATC TAGTTACCGT ACAATCCCAA 
ATCCCAGTTT ACGCAATAGT AAACGGAGCT AACGAGACCT TAAACTCTAC AAACTGGTTC 
ACACAAGGCA CTACAATCAA ACTAGAAAAT ATAACGAAAT ACGTAAGCAG TGTTGAGAGA 
TATGTAATAG CTAATTTCTC ACCCTCAGAG GTTATAACAG TAAATCAGCC TACTACGATA 
AAAGTAAATA CTGTAACCCA ATATTTCATT AACGTTAACT CTCCAGTTCA ATTAAAAGCC 
TTAATAAACG GCGCAAATGA AAGCCTTACA GCAGGTTGGT ATAATCAAGG AACATCAATC 
AAAATAGAGA ACCTTACATA CTACGTGGGA AATGGAGAGA GATTAATCTT AGGTAAAGTT 
CTTCCATCCT TAGAGATAAT TGTAAATGGC TCCTATACCA TAAGCACTAC AACCATAACT 
CAATACTTCG TCAACGTCTC TTCTCCCATA CCAGTCCAAG TACTAATTAA CGGTTCTAAG 
ACTATACTTA ACTCCTCCTG GATAAACGCT GGAACATCGA TACTAGTGTT AAACTACACT 
TACAACATTA GTCCACAAGA GAGGGTTATA ATAGTTGGTA TATCACCCTC ACAGTCATTT 
ACAGTGAACT CACCCGAAAC CCTAAAGCTA CTTACAGTCA CACAATATCT AGTCACAATT 
AATGGTGTGT CTAAATTCTA TAACTCGGGA TCAAAGATAG TCCTTAATGC GAGTGTGCCA 
TTCTACGAAA CTGCCACGTT TAAGGGAACG TATAATGTCT CTCCGGGAGC TACAATTACA 
GTGAACCAAC CAATAACTGA AACATTAGTA GAATCTCCAA ATTACTTAAT TTTAGGAGCA 
ATAGCAGCTG TTATAATAAT AGTAGTAGCT GTGGTGGTAA TAATCCTCTT AAGGCGTTAA

Protein sequence

MKAKHLISLI VILTPLVTLL TSAVYTSGGI TFYSPAYNGE SYYTGQSITI DALLPQQFAT 
DAATINFFFP NSSLAVTIPV QINGSGGIYV PNAYAFPNVP GTWQITIEVA GGVAVGTINV 
NVIQRTPLVT VHLGYGVVGQ ALPQTPTITL TFPNGTTITV PLQGTVNVPS GTSYQVEQAI 
TENNIRWATN YTSGTITPAT TSITPTYYQQ YLVTFNYTVQ GGTGYSPPTV YYRSLGMNET 
AKAPASVWVD ANSAYIYSPE LQSNVQGERW IAVNFTGIIK APGEINEYYI NQYLVTVQSQ 
IPVYAIVNGA NETLNSTNWF TQGTTIKLEN ITKYVSSVER YVIANFSPSE VITVNQPTTI 
KVNTVTQYFI NVNSPVQLKA LINGANESLT AGWYNQGTSI KIENLTYYVG NGERLILGKV 
LPSLEIIVNG SYTISTTTIT QYFVNVSSPI PVQVLINGSK TILNSSWINA GTSILVLNYT 
YNISPQERVI IVGISPSQSF TVNSPETLKL LTVTQYLVTI NGVSKFYNSG SKIVLNASVP 
FYETATFKGT YNVSPGATIT VNQPITETLV ESPNYLILGA IAAVIIIVVA VVVIILLRR