Gene Ssol_0789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_0789
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	729197
End bp	730456
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	39%
IMG OID
Product	Mandelate racemase/muconate lactonizing protein
Protein accession	ACX91043
Protein GI	261601440
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAACTAA AAATTACTGA TTTCAAAGTT TTCGTAGCTC AGGCCAATTT CGAATGGGCT 
TTTGTGAGAA TCTACTCCAA AGACTTATAT GGTACTGGTG AGGCAGGTCC TGCGCCAGGT 
TTAAAGGGAA TGGAAAGCGA GTTTATACAA TTACTAATTG GAGAAGACGC ATTCAAAGTT 
AATAGGATAG CTGAGAAACT CAGGTACGCT ACACTATACT CTGGAACTAC TGTATATCAC 
TTGATCTCAG CCATTAATAT TGCACTGTAC GATCTTATTG GGAAATACCT AAATGTACCA 
ATATACAAAT TACTAGGTGG GGATAAGACG GAAATACCAG TCTATGTCGA CGCTCATGGA 
GGGAAAGGGT TAGAAGCAAT TAATGCTTTA CACTTACCAG TTAATTTACC TTGGATCAAG 
GAGGCTGAGG TGGAGACAAA TAGGTTGATC ACAACCAATA ATCCAGTTCA TGGTAGGTTA 
TCAATGGAAA AGTGGAATGA AGATTATTCA CCTGAGGCAT ACGCTAAGAG AGCTCTAAAG 
ATGAAGAACG AGGGTTATAA AGCCATGAAA TTTGATCTAG ACGTACCTAC ACCTTATATA 
GATTTAAGGA GAGTAAGAAA TGGAGATTTA TCTCTTAAAG ATATCGACTA CATGGTAGAT 
ATAGTAAAGG CAGTTAGAGA GTCCGTTGGC GATGAGGTCG AAATAATGTT CGATTTGCAT 
TGGAGATATA ATTTAAATAC TGCAATTAGG ATTTGTAAGG CACTAGAACC ATATAGACTA 
AGATGGCTAG AGGATCCAAT GCCGGCAATA ATGGCTGTTT CCAATTACGA CGAGTTAAAG 
TTGTTGACCT CTCAGTGTTC AGTTCCGATA GAGACTGGCG AGAACCTCTA TACAGTATAT 
CAGTTCAAGG ATTTGCTCAA TACTGGAGTT AGAGTGTGGG CTCCGGATAT AGTTAAAGCT 
GGTGGAATAA CCGAGGGAAG GAGAATAGCT GAATTAGCTG CCATGTATGA TATAGAATAC 
TCTCCTCATA ATATAGCATC ACCAATAGGT ACTATGGCTC ATGCCCATGT AGGGTCAATT 
GCAAACACAT TCGGTTTTGT GGAATTTCAT GGTCACGATG TACCATTTTG GAATGAGATC 
GTTAAGCCGA AGAGAAAGAT TATAGAAGAT GGTGTGATTA AGCTTACCGA TGACCCTGGA 
TTGGGCATAG ATCTAGACGA TGAGGTAATG AGAAAATATT GGCCAACTTA TGAGTTATGA

Protein sequence

MELKITDFKV FVAQANFEWA FVRIYSKDLY GTGEAGPAPG LKGMESEFIQ LLIGEDAFKV 
NRIAEKLRYA TLYSGTTVYH LISAINIALY DLIGKYLNVP IYKLLGGDKT EIPVYVDAHG 
GKGLEAINAL HLPVNLPWIK EAEVETNRLI TTNNPVHGRL SMEKWNEDYS PEAYAKRALK 
MKNEGYKAMK FDLDVPTPYI DLRRVRNGDL SLKDIDYMVD IVKAVRESVG DEVEIMFDLH 
WRYNLNTAIR ICKALEPYRL RWLEDPMPAI MAVSNYDELK LLTSQCSVPI ETGENLYTVY 
QFKDLLNTGV RVWAPDIVKA GGITEGRRIA ELAAMYDIEY SPHNIASPIG TMAHAHVGSI 
ANTFGFVEFH GHDVPFWNEI VKPKRKIIED GVIKLTDDPG LGIDLDDEVM RKYWPTYEL