Gene Ssol_0437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0437
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	393732
End bp	395039
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	38%
IMG OID
Product	Phenylacetate--CoA ligase
Protein accession	ACX90720
Protein GI	261601117
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.288534
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGTTA AGTTAACTTA TAATGAGATA GATCCCAAGG CATTAACTAA GGAAGAGATT 
AAAGAGATCC AGCGATTTAG ACTTAGGGGT TTAATTAAAA GAGTTTATGA GAGCTCACCC 
TACTATCATA AGGTGTTTAA AGAAAGGGGA TTAACGCCAG ATGATATAAG AACTCTAGAG 
GATTTAGTTA AACTTCCTTT CACCACTAAG GAAGATTTAA GGAGATACGC TTATCCACAT 
GGTGGCGATT TCTTAGCAGT TCCCTTTGGA AATTTAGTAG GATGGCATAT GACATCAGGA 
ACGACAGGAG TTCCCACAGT AAACGCTTAT ACTTGGAGCG ATATTGAAAT ATGGACAAGC 
CTCGTAGCAA GAAGTCTAGT CACTGCTGGA GTTACAAAGA ATGATATTGT TATGAACATT 
TATGGGTACG GGTTATTCAC TGGTGGGATT GGCTTACATC AAGGTATCCA GAGAATAGGG 
GCTAAGGTGA TACCGTGGAG TACTGGCAGA ACTGAAGCTT TAGCTCGGGC ACTAAAGGAC 
TTTAAAGCTA CTGTAATAAC TGGTACTCCA TCTTACGAAT TGCTAATAGC TGAAACTTTA 
CGCAAACTAA ACATAGATGC TGAGAAGGAA TTGCAACTTA GATTAGCAAT CCCCGGTGCT 
GAAGCAATGT CAAAAGAGAT GTTGGAGAGA ATTGAGCACG AATTAGGACT AAAGGCTAGA 
GAAGGAAGGG CATTAGAAAT TTATGGTTTA ACCGAGGCTT TAGGGCCAGG AGTTGCACAA 
GAGTGTCCAG ACGATAATCA CGAATGGCTA CATATATGGA CTGATCATTA TTTGGTTGAG 
ATTATTGATC CAGAGACCGG TGAGAGAATT TCTGAAGATG AAGAAGGGGA AATGGTTATA 
ACTACTCTCA GTAAGGAAGG GATGCCGTTA ATTAGATATA GAACGAGAGA TATTACTAGA 
CTTATTGAAA GTGATGATGA AATACCGTTT CCTAAAATAG GAATGTTAAA AGGGAGAGTA 
GATGATGTGA TATTCTATAA AGGTGTGAAA GTATTCCCAA CTGCTATATC GAATGTTTTA 
ATGTCTTGCG AGGAGGTAAA AGAGTTTCAA ATAGTAGTAG ATAAGACTAA TAGGGAGCAT 
AGATTAATAG TTAGAGTAGA AACTGAAAAA CCGTCAGAAA AATTAGCTGA AAAACTGATA 
GAAGAAATTA GAACAGTAGC ATTTGTAACG CCTGAGGTGG AGTTTGTGAG TTTAGGCACA 
CTGCCTAGAT TTGAGGGTAA GTCTAAGAGG GTAGTTATTA AAGAGTAA

Protein sequence

MSVKLTYNEI DPKALTKEEI KEIQRFRLRG LIKRVYESSP YYHKVFKERG LTPDDIRTLE 
DLVKLPFTTK EDLRRYAYPH GGDFLAVPFG NLVGWHMTSG TTGVPTVNAY TWSDIEIWTS 
LVARSLVTAG VTKNDIVMNI YGYGLFTGGI GLHQGIQRIG AKVIPWSTGR TEALARALKD 
FKATVITGTP SYELLIAETL RKLNIDAEKE LQLRLAIPGA EAMSKEMLER IEHELGLKAR 
EGRALEIYGL TEALGPGVAQ ECPDDNHEWL HIWTDHYLVE IIDPETGERI SEDEEGEMVI 
TTLSKEGMPL IRYRTRDITR LIESDDEIPF PKIGMLKGRV DDVIFYKGVK VFPTAISNVL 
MSCEEVKEFQ IVVDKTNREH RLIVRVETEK PSEKLAEKLI EEIRTVAFVT PEVEFVSLGT 
LPRFEGKSKR VVIKE