Gene Ssol_1206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1206
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1124485
End bp	1126287
Gene Length	1803 bp
Protein Length	600 aa
Translation table	11
GC content	35%
IMG OID
Product	translation initiation factor aIF-2
Protein accession	ACX91444
Protein GI	261601841
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.142011
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTA GCAACTCTGA GAGAAGGCTT AGGCAACCTA TAGTAGTAGT ATTAGGCCAT 
GTAGATCATG GAAAAACTAC ACTACTTGAT AAAATAAGGG GTACAACAGT AGTTAAAAAG 
GAACCTGGAG AAATGACACA AGAGGTAGGA GCTAGTTTCG TTCCAAGTTA TATAATTGAA 
AAATTAGCAG AACCTCTTAA GAAGGTAATA CCCATAAAAC TTCAGATACC AGGATTATTG 
TTTATTGACA CGCCAGGTCA TGAATATTTT TCAAACTTGA GAAGAAGAGG TGGAAGCGTA 
GCAGATATTG CGATCCTAGT TGTTGATATA ACTGAAGGCC TACAGAAGCA ATCAATAGAA 
TCAATACAAA TACTAAGAGA AAGAAAAGTT CCATTTCTCA TAGCTGCTAA TAAAATAGAT 
AAAATACCCG GATGGAAATC AAATAATGAC ATACCGTTTT TAGCATCAAT CGAGAAACAG 
AGGAATGATG TGAAAGTTTA TCTAGACAAC TTAGTCTATA ATTTAGTTTC TCAATTAGCA 
AACTTAGGCT TTAGCTCAGA ACGTTATGAT AGAATAAAGG ATTTCACTAA AACAGTAGCA 
ATAGTTCCGG TTTCTGCAAA GACCGGTGAA GGCGTTGCAG ATCTTTTAGC ATTACTAGCT 
GGATTAACCC AAAGGTACTT AGAGACTAGA TTAAAATTTG CAGAGGGTCC AGCAAAGGGA 
GTTATATTAG AAGTAAAAGA AGATCCAGGG TTAGGACACA CCATAGATGT TATAATTTAT 
GATGGAGTGC TTAAGAAAAA TGATACTATA ATATTAGGAG GCATTAACGG CATTATTATA 
ACTAAAGTTA GAGGAATATT TGTACCTAGA CCATTACAAG ATATGAAATT AAGCAAGTAT 
GATCTAACGC CAATAGATGA AGTATATGCA GCAGCTGGAG TGAAGATATC TGCACCCAAT 
TTAGAGGAAG CATTAGCTGG ATCACCAATT TATGTGGTAG AAGACGAGTC TAAGGTTGAG 
CGATATAAAC AACAGATAGA AGAGGAAATT AAAGAAGTTA GACTCTACAG CGATATTGAC 
GGAATAATAC TCAAGGCAGA TAGTTTAGGA ACATTAGAAG CCTTAGTTAG TGCTCTGCAG 
CGTGAAGGGA TTCCAATAAG GCTAGCGGAC ATAGGGCCGA TTTCGAAAAG AGATGTTATA 
GAAGCGAGTA TAGTAGCTCA AAGATCAAAA GAATATGGAA TTATTGCTGC TTTTAGAGTA 
AAGTTATTAC AAGGAATTGA TACTAGTGGA ATAAAAATAT TGTATAACGA AATAATTTAT 
CAATTAATCG AAGATATCAA GAAGCATATT AATGATGTCA GGGAAGCGGA AAAAAGGCGC 
ACGTTTGACA CATTAATATT GCCAGGGAAA ATAAAGATCT TGCCGGGTTA TGTATTTAGA 
CGCAGTGACC CAGTAGTAGT AGGTATTGAG GTTATAGGAG GCATTATAAG ACCTAAGTAT 
CCGTTAATTA AGGAAGATGG AAGGAGAGTC GGTGAGGTAC TACAAATCCA GGATAATAAG 
AAAAGTCTAG AAAGAGCCAC TAAAGGAATG GAAGTTGCAA TATCAATTAA AGGCAATATA 
ATGATTGGGA GACATGTAAA TGAAGGGGAT GTTTTATACA CAGACGTACC TAAAGAAGAC 
CTCGAGATAT TAGTCAACAA GTATCCAAGT TCTATTACAG ATGATATGAG GGAAGTAATA 
AAAGAAATAA TAAGAATAAA GAGAAAAGAA GATCCTTTAT ATGGATTAGG ATTACAGATC 
TGA

Protein sequence

MKISNSERRL RQPIVVVLGH VDHGKTTLLD KIRGTTVVKK EPGEMTQEVG ASFVPSYIIE 
KLAEPLKKVI PIKLQIPGLL FIDTPGHEYF SNLRRRGGSV ADIAILVVDI TEGLQKQSIE 
SIQILRERKV PFLIAANKID KIPGWKSNND IPFLASIEKQ RNDVKVYLDN LVYNLVSQLA 
NLGFSSERYD RIKDFTKTVA IVPVSAKTGE GVADLLALLA GLTQRYLETR LKFAEGPAKG 
VILEVKEDPG LGHTIDVIIY DGVLKKNDTI ILGGINGIII TKVRGIFVPR PLQDMKLSKY 
DLTPIDEVYA AAGVKISAPN LEEALAGSPI YVVEDESKVE RYKQQIEEEI KEVRLYSDID 
GIILKADSLG TLEALVSALQ REGIPIRLAD IGPISKRDVI EASIVAQRSK EYGIIAAFRV 
KLLQGIDTSG IKILYNEIIY QLIEDIKKHI NDVREAEKRR TFDTLILPGK IKILPGYVFR 
RSDPVVVGIE VIGGIIRPKY PLIKEDGRRV GEVLQIQDNK KSLERATKGM EVAISIKGNI 
MIGRHVNEGD VLYTDVPKED LEILVNKYPS SITDDMREVI KEIIRIKRKE DPLYGLGLQI