Gene Ssol_1966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1966
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1750874
End bp	1752217
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	34%
IMG OID
Product	Alpha-amylase
Protein accession	ACX92177
Protein GI	261602574
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0717936
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAG TAATAGTAGG ATTTGAAGTT CACCAACCAT TCAGGATTAG AAGAGATTTC 
TTCTGGAACC CGCGATTTAG ACAAAAGCTA GAGGATAGAT TTTTCGATAC TGAGAGAAAT 
AAAGAGATAT TTGAGAGAAT AAAGAAGAAC TGCTACATCC CTGCAACAAA CATAATACTA 
AGCTCTATTG AAAGAGCCGA AGAAGAAGGA AATAACGTTA AATACTTCTT TTCAATTTCA 
GGGACTTTCT TAGAGCAAGC GGAGAGATGG GGAAGAGAGG TAATAGAATT ATTTCAACAA 
TTGGCATATA CACATAAAGT TGAATTTCTA GCGCAAACCT ATTATCATTC TGTAACCAGC 
CTTTGGGAGG ATAAAAGTGA ATGGAAAGAG CAAGTTAAGA TGCATAAGGA TACGATAAAG 
TCTTATTTTG GACAATATCC TACCACTTTT GAAAATACTG AATTAATTAC TAAAAAGGAT 
ATTGTAGAAG AAGTTGAAAA AATGGGCTTT AAGATGATGT TAAGTGAGGG AACTAATAGA 
AATTTAAATG GACGAAGTCC AAATTACGTC TATAAATTGA AGGGACATGA GATTAGAATG 
TTGTTTAGGA ATTATACGTT AAGTGATGAT ATAGCCTTCA GATTTTCTAA TCCAAATTGG 
GATCAATATC CGTTAACAGC TTCCAAGTAT GCTGATTGGA TAAGTAGAAG TGAGGGAAAT 
GTAGGATTAA TATTCGTAGA TTACGAGACT TTTGGAGAAC ACCACAGAGA ACAAACTGGA 
ATTTTAGAAT TTCTTAAATG GTTACCAATA GAGCTTAACA GTAAAGGAGT TGAAATGATG 
ATGCCAAAGG AAGTTTACAA TGACGTCTAT GATGAAATAG AAATTGCTCA TACTACCTCG 
TGGGCTGATA TAGAAAAAGA TGAGAAAAGT TGGTTGGGAA ATATAATGCA ATGGGCTTAC 
GATGATGCGG TTAGAAGGGC TGAGATGCCC TCAAGGGAAT TGGGTAATGA GTATTTAAGG 
GTCTGGAGAT ATTTTACTAC AAGCGATAAT TACTATTATC TTTATTTAGG GCATGGGAGT 
CCAGCTGAAG TACATTCCTA TTTTAACGCC TTTGGATCCC CTATAGATGC GTTTATAAAT 
GAATTTTATG CAATATCGAC ATTTATACAT GAAGAAATAA GTAAATTAAA TATTAAGAAT 
GAGCCTTATA TATTCATATT AGGAGATAAG AGAGCGTCGA TAGCTTGGAA TGAAAAAGAG 
TTCATGGAAA TTGTAATGAG AGATGAAAGG TTTAAAACTC ATTTGAAAAA CTTAAGGCTG 
TGGTTAGGAA ATGAAAAGGA TTGA

Protein sequence

MKRVIVGFEV HQPFRIRRDF FWNPRFRQKL EDRFFDTERN KEIFERIKKN CYIPATNIIL 
SSIERAEEEG NNVKYFFSIS GTFLEQAERW GREVIELFQQ LAYTHKVEFL AQTYYHSVTS 
LWEDKSEWKE QVKMHKDTIK SYFGQYPTTF ENTELITKKD IVEEVEKMGF KMMLSEGTNR 
NLNGRSPNYV YKLKGHEIRM LFRNYTLSDD IAFRFSNPNW DQYPLTASKY ADWISRSEGN 
VGLIFVDYET FGEHHREQTG ILEFLKWLPI ELNSKGVEMM MPKEVYNDVY DEIEIAHTTS 
WADIEKDEKS WLGNIMQWAY DDAVRRAEMP SRELGNEYLR VWRYFTTSDN YYYLYLGHGS 
PAEVHSYFNA FGSPIDAFIN EFYAISTFIH EEISKLNIKN EPYIFILGDK RASIAWNEKE 
FMEIVMRDER FKTHLKNLRL WLGNEKD