Gene Ssol_1696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1696
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	1521371
End bp	1522810
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	38%
IMG OID
Product	phosphoribosylamine/glycine ligase
Protein accession	ACX91913
Protein GI	261602310
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAT TACTCGTTGG AGATGGAGCT AGAGAAAACG TTCTAGCCTA TTCGTTGGCA 
AGATCATCTA AAGGTTACAA GATTTACGCA CTATCGTCAT ATATAAATCC CGGGATTAAT 
TCAATAGTGA AAACCACTGG TGCAGAGTAT TTTATAGGTA ACGTAAACTC CCCAGAAGTT 
ATTAAGGAGG TAATTAAGAA AGTAAACCCA GATTTAGGCG TAATTGGACC AGAAGATCCC 
TTATTCAACG GAATTGCGGA CATTTTTAGA AAAGAGGGAA TATCGGTATT CGGGGCTAGC 
AAAAAGTGTG CAAGGATAGA GGAGTCTAAG GCATGGGCAA GAGAGTTAAT GTGGAAACAT 
TCTATTCCAG GAAGATTAAG ATATAAGGTA TTTTACACAA TAGAAGATAC TGCAAAGTTC 
ATATTAGAAT ATGGCGGATC AGTCGCAATA AAACCTGCTG GGCAAGCTGG AGGAAAAGGG 
GTTAAGGTAA TAGCTGATCT AGAGGCTTAT TTAACCCATG ATAAGAGAGA GGCACTGACA 
AAAAGCGTGA ATGAAATAGG GAGTCTATAC AATAAGGAAG GTGAGCCGAG AATTATAATA 
GAGGAGAAAG TTGATGGACC AGAATACACA CTTCATGTTT TAAGTGATGG GAAAACAACT 
ATCTCCTTAC CTTTGGCTCA AGATTATAAG AACGCGTATC AAGACGGAAT AGGTCCAGAG 
ACTGGAGGAA TGGGATCAAT TTCTGGACCT AACGAATTGC TTCCATTTAT CAGCAATGAA 
GAGTATCAAA CAACTTATGA TATAGTTAAA AGGACTATGG ATGCGATATA CAAGGAGACT 
GGAGAGAGAT ACGTAGGAGT TATTGCAGGA CAAATGATGT TAACTGAACT TTGGGGACCT 
ACAGTAATTG AGTATTATTC AAGATTTGGT GATCCAGAAG CTTCCGCCAT AATTCCAAGA 
TTAGAATCTG ATTTTGGAGA GACAATTGAG CTCACAGCTA CTGGACATTT GAATAAAGCT 
AGTATAAAAA TAAACGAGAA ACCTTCTATA GTCAGAGCTG TTGCTACATT AGGATACCCT 
ATCTCAAAAC AAATGGCATC TGGGCATAAG ATTGTAGTAG ATTTAGAAAA GATGAAAGAG 
CGCGGATGCG TGGTATTTTT TGGATCTGTA GCATTAGAGG GAATGCAACT TATAACTAAA 
GGCTCTAGAG CTTTAGAAAT AGTTGCAATA GGAGATTTCG AAGAAGCTGC TGAGAACTTA 
GACAGATGTA TGCAATATAT TAGCAGTGAT ACTAAATTGA TATATAGGAC TGATATTGGG 
AGGACAGTTA AATCTCAAAT TGAAAAGGCT GAAATCATAA GATATTCTTA TAAAAATAGA 
GAAAAAAGAG GGATTCTTGG AGTTTCTGCA GATTGGTCTC CTAATGGTGG GTTATGGTGA

Protein sequence

MKVLLVGDGA RENVLAYSLA RSSKGYKIYA LSSYINPGIN SIVKTTGAEY FIGNVNSPEV 
IKEVIKKVNP DLGVIGPEDP LFNGIADIFR KEGISVFGAS KKCARIEESK AWARELMWKH 
SIPGRLRYKV FYTIEDTAKF ILEYGGSVAI KPAGQAGGKG VKVIADLEAY LTHDKREALT 
KSVNEIGSLY NKEGEPRIII EEKVDGPEYT LHVLSDGKTT ISLPLAQDYK NAYQDGIGPE 
TGGMGSISGP NELLPFISNE EYQTTYDIVK RTMDAIYKET GERYVGVIAG QMMLTELWGP 
TVIEYYSRFG DPEASAIIPR LESDFGETIE LTATGHLNKA SIKINEKPSI VRAVATLGYP 
ISKQMASGHK IVVDLEKMKE RGCVVFFGSV ALEGMQLITK GSRALEIVAI GDFEEAAENL 
DRCMQYISSD TKLIYRTDIG RTVKSQIEKA EIIRYSYKNR EKRGILGVSA DWSPNGGLW