Gene Ssol_1364 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1364
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1261832
End bp	1263061
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	38%
IMG OID
Product	glycosyl transferase group 1
Protein accession	ACX91598
Protein GI	261601995
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTACAC TGGGAGTTGT CTACGATAAA TTCCTCTCAC CGTATTTTGC TGGTGGTGGA 
GCCGTTCATG CTTATGAGGT TACGATTAGG CTTAAGGAGC ATTTCAAAAT TGTATATTAC 
CCTTCTAGCC CAGTCCTTTC ATGGGATAAG GAGAACGTAG AGAAGAAGGC TAAGGAATTA 
GAGAGCCAAG GCATAAAGGT TGCTGATGAA TTTTATGAGA TATTGGAGGA GAAGAGGAGA 
ATTGGAAGGC TTAAGAGGTT TTTATTTGCC GATAAGATCG CTAGGGAGTT TTCCAAGGGT 
TTTAAAGTTG ACGCCGATAT CTTGTACGAG CCAGACCACA CATCCCTTGA TATTTTCTAT 
CTGGCTAGGG ATACTAAATA TGGCGTAACT TTCCATGAAC CCCCCTTTTA TAATAACTCC 
CTTAGATACT TTAGGAGATT AGTCAAATTT TATGGTGTAA ATCCATATAC TGGAAAAGGT 
TTTCACACTA GGTTTCTATA CAACGAGTAT ATAAAATATT TGTATAAGAG GTTGTTTAAA 
AAAGTGAAAA AACCTACTTT TTTAGCTGGT GTCAGTGAAG CTCCTTTACT TGAGTCTGGT 
TTAGGTGGTG AGGTTATTAA ACCCGGAAAT GCTTTTAATC CTTCTCTTCT GAAGTTTAGG 
AATAGGGGGA AAGAGGATTA CGTTGTATTC TGGAGTAGGT TAAATCAAGA TAAGGGTTTT 
CATGAGTTGC CAGACATTTT GCGCATTATG GAAAAGAGGG GTGGTAATAA GGTAAGGTTA 
ATTCTAATGG GCAAATTTTT CGATAAATAC AACGAGAGGA GGTTTTGGTC TAAGGTCAGA 
AAATACGATT TGAGGGTTGA CTATAAGGGC TTTGTTAAGA GGGAGGAGTT AGCAGATATT 
GTTTCTAAGG CTAAGGTTCT AATTTATCCA TCTCATGTTG ATGGTTTCTC ATTAGTTGCT 
CTAGAATCTC TAGCCCTAGG TACGCCGGTT GTTGCCTATG ACATTCCCGC AATTAAGAGT 
GTTTATGGAG GATTAGAGTG TGTTAGGATT GTTAATGAAT TCGATAAGGA AAGTATGGCT 
GAAAACGCTT TAAAGTTCTA CAAAATGAGT GAGAAAGAAA TTGAAGAGAT CATGAATGGA 
GATAAGTTAA TGGAATTCTT AAAGCTGCAT TCGAATTGGG ATAATGTTGC CAATTCTGTC 
TTGAAAATTT TAAAGAAGTA TCTTATTTGA

Protein sequence

MTTLGVVYDK FLSPYFAGGG AVHAYEVTIR LKEHFKIVYY PSSPVLSWDK ENVEKKAKEL 
ESQGIKVADE FYEILEEKRR IGRLKRFLFA DKIAREFSKG FKVDADILYE PDHTSLDIFY 
LARDTKYGVT FHEPPFYNNS LRYFRRLVKF YGVNPYTGKG FHTRFLYNEY IKYLYKRLFK 
KVKKPTFLAG VSEAPLLESG LGGEVIKPGN AFNPSLLKFR NRGKEDYVVF WSRLNQDKGF 
HELPDILRIM EKRGGNKVRL ILMGKFFDKY NERRFWSKVR KYDLRVDYKG FVKREELADI 
VSKAKVLIYP SHVDGFSLVA LESLALGTPV VAYDIPAIKS VYGGLECVRI VNEFDKESMA 
ENALKFYKMS EKEIEEIMNG DKLMEFLKLH SNWDNVANSV LKILKKYLI