Gene Ssol_0268 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0268
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	228557
End bp	230128
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	40%
IMG OID
Product	carboxyl transferase
Protein accession	ACX90564
Protein GI	261600961
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTCTAT ATGAAAAACC TCCAATGGAT AAATTAATAG AAGATCTGAA AATATTGAAG 
GAAAAAGCAT ATAAAGGCGG AGGAGAGGAG AGAGTAAACT TTCAGCATAG CAAAGGGAAA 
CTAACAGCGA GGGAGAGGTT AAATCTATTA TTCGACGAAG GAACATTCAA TGAAATATTA 
ACATTTGCCA CTACTAGAGC AACAGAATTC GGGTTAGATA GGAATAAGTT TTACGGAGAT 
GGAGTGATAG CTGGATGGGG AAAAGTAGAT GGCAGACAAG TTTTCGCTTA CGCTCAAGAC 
TTTACGGTTC TCGGAGGAAG TCTAGGAGAA ACACATGCAA ACAAGATAGT TAGAGCTTAT 
GAGCTAGCCC TAAAGGTTGG CGCTCCGGTA ATAGGAATAA ACGATTCCGG AGGTGCCAGA 
ATACAAGAAG GCGCATTATC TCTAGAAGGA TATGGTGCAG TGTTTAAGAT GAACGTAATG 
GCGTCTGGAG TAATTCCCCA AATTACCATT ATGGCAGGAC CGGCAGCTGG AGGGGCTGTC 
TACTCGCCTG CTCTAACCGA CTTCTTAATA ATGATAAAAG GAGACGCGTA TTACATGTTT 
GTAACCGGCC CAGAGATTAC TAAAGTGTCA ATAGGGGAAG AAGTTAGTTA CCAAGATCTA 
GGTGGTGCAA TAGTTCACGC AACCAAGTCT GGAGTAGTTC ATTTTGTAGC TGAAAACGAA 
CAAGATGCGA TAAATATAGC TAAGAGGTTA CTCTCCTATT TGCCTTCAAA TAATATGGAA 
GAGCCCCCAT ATATTGATAC TGGTGATCCC GCTGATAGAG AAGTACAAGG TGCAGAGTCA 
ATAGTGCCTA CTGACTCAGT AAAACCATTC GACATAAGAG ACCTAATATA TAATATAGTT 
GACAATAGCG AATTCTTGGA AGTTCACAAA TTATGGGCAC AAAATATTAC TGTAGGGTTT 
GGAAGGATAA ATGGAAACGT TGTGGGCATT ATTGCTAATA ATTCAGCATA CTATGGAGGA 
GCAATAGATA TTGATGCAGC GGATAAAGCT GCCAGATTTA TCAGATTCTG TGATGCGTTC 
AACATACCGT TAATAAGTCT TGTAGATACG CCTGGTTATG TACCCGGAAC AGATCAAGAA 
TATAAAGGGA TAATAAGACA TGGTGCTAAA ATGTTATACG CGTTTGCTGA GGCTACAGTA 
CCAAAGATAA CAGTTATTGT AAGAAGGTCT TATGGTGGTG CTCACATCGC AATGAGTATT 
AAAAGCTTAG GTGCTGACCT AGTTTATGCT TGGCCATCTG CAGAAATAGC CGTAACTGGC 
CCAGAAGGTG CAGTTAGAAT ATTATATAGG AGGGAAATAC AAAATGCGCA AAATCCGGAA 
GAATTCTTAA AACAAAAAAT AGCCGAGTAC AAGAAATTAT TCGCGAATCC TTACTGGGCA 
GCCGAGAAGG GTCTTATAGA CGATGTTATT GAGCCTAAAG ACACTAGAAA AGTAATATCT 
AGAGGATTAG AAATACTAAG AAATAAAAGA GAATTCAGAT ATCCTAAGAA ACATGGAAAT 
ATACCTCTAT AG

Protein sequence

MSLYEKPPMD KLIEDLKILK EKAYKGGGEE RVNFQHSKGK LTARERLNLL FDEGTFNEIL 
TFATTRATEF GLDRNKFYGD GVIAGWGKVD GRQVFAYAQD FTVLGGSLGE THANKIVRAY 
ELALKVGAPV IGINDSGGAR IQEGALSLEG YGAVFKMNVM ASGVIPQITI MAGPAAGGAV 
YSPALTDFLI MIKGDAYYMF VTGPEITKVS IGEEVSYQDL GGAIVHATKS GVVHFVAENE 
QDAINIAKRL LSYLPSNNME EPPYIDTGDP ADREVQGAES IVPTDSVKPF DIRDLIYNIV 
DNSEFLEVHK LWAQNITVGF GRINGNVVGI IANNSAYYGG AIDIDAADKA ARFIRFCDAF 
NIPLISLVDT PGYVPGTDQE YKGIIRHGAK MLYAFAEATV PKITVIVRRS YGGAHIAMSI 
KSLGADLVYA WPSAEIAVTG PEGAVRILYR REIQNAQNPE EFLKQKIAEY KKLFANPYWA 
AEKGLIDDVI EPKDTRKVIS RGLEILRNKR EFRYPKKHGN IPL