Gene Ssol_1984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_1984
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	-
Start bp	1771054
End bp	1772460
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	37%
IMG OID
Product	amino acid permease-associated region
Protein accession	ACX92195
Protein GI	261602592
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGAAG AAAAAAAGAA TGTAAGTGAA TTGAGAAAAG GTGTCCTTGG TACTTGGCTT 
GTTGCAAGTT ATGGAATTGC AGCTAATGCC CCAATAGCTG TTGCCACACT CTATTTTGTG 
GGCCTTGCTG GATTGGTAGG AGGAGCTATG CCACTCACTG TGATACTTTC GTACTTGATC 
TATGCTACTA CACTTATTGT TATTTATGAG TGGAGCAAGG AGATTGCAGC TTCATATGGC 
TATGTTGCTA TGATAAAGAA GGGATTAGGC AGTAGTTTGG CTTCCTTTAC TGTAGGATAT 
GGTTATATTT ATCAATATCT TGTTGCTGGA ACAGCTGGAT TTGGAATATT AGGAATTGCG 
TCTTTCATCT ACTTGATCTC TCCCAGTATT GCTTCTTCAA TGCCTTGGTT ATGGGCAGCA 
ATAGTGATTA TAGTTACAAT TGAGATTACA ACAATAATGT GGCTTGGAGT GAAGCCTGGA 
GGTCTGTTAA ATCTCGTAAT AGGATTGATT TCAATAGGTT TTCTAATTAT AACTTCGATC 
GTTTTAATTG CTGGAGCAAA GAATAGTATT TTACCGTTTA CGGCTGTTCC GGTTAACAAC 
AATTGGGCGC TGGTACTTAC GGCAATGATT TTTGGTGTTA CTACTTTTGG TGGTGCCACA 
ACTCCAATAG GAGTAGCGGA AGAAGCTAAG GTTCCAAAAA GTACTTTGCC AAAGGCACTT 
CTCTTAACGT TTGGAATACT TGGAGTTGGA TTGATATTGA ATTCTTATGC GCAGACGATA 
GTTTATGGAA TAAATAATAT GTTTAATTAT GCTAATCTTC CAGACCCAAT GATAGTGATT 
TATAGTAAGT ATTTCAATCC CGCTATTGTA TATATGTTAA TAATACTTGT AGCGTTTATG 
TTTAACTCTT CTGCATTAGC GTTTGCTACT AGTGGGAGTA GAATGATATT CGGTATGGCT 
AGGGATGGTG TATTATATCC TAAAGTCTTT TCAAAAGTTA ATAAATACGG TGTGCCGGGT 
AATGCAATAA TACTTACTGG TATTGTTACA GGTGCTCTTA GCCTTATAAG TGGTTACATT 
CTAGGTCCGT TAGAGGCTAG TATATTTTTA ATAACATTTG GCTCATTCTA CGTCGCCTTA 
GGTCATTTAT TTGCTGCCTT AGGGTTAATT GTACGTAAGG TTAAAATGCG TACGGCTAAC 
ATAGCGAAAC ACGTAGTGAT ACCGATAATT TCAATACTAT TATATATTGC TGTAATATAT 
TTTGGTACTT ACCCTGCGCC AGCTTTCCCA TTAAATATAG CAGTTTATGC AGCTTGGGCT 
ATTCTTTTGA TTCACATAAT TACATATTAT GTGATAAAGA GCAGATTTCC AGACAGAATT 
AAGAAGTTCG GTGATTATAG TCTTTGA

Protein sequence

MDEEKKNVSE LRKGVLGTWL VASYGIAANA PIAVATLYFV GLAGLVGGAM PLTVILSYLI 
YATTLIVIYE WSKEIAASYG YVAMIKKGLG SSLASFTVGY GYIYQYLVAG TAGFGILGIA 
SFIYLISPSI ASSMPWLWAA IVIIVTIEIT TIMWLGVKPG GLLNLVIGLI SIGFLIITSI 
VLIAGAKNSI LPFTAVPVNN NWALVLTAMI FGVTTFGGAT TPIGVAEEAK VPKSTLPKAL 
LLTFGILGVG LILNSYAQTI VYGINNMFNY ANLPDPMIVI YSKYFNPAIV YMLIILVAFM 
FNSSALAFAT SGSRMIFGMA RDGVLYPKVF SKVNKYGVPG NAIILTGIVT GALSLISGYI 
LGPLEASIFL ITFGSFYVAL GHLFAALGLI VRKVKMRTAN IAKHVVIPII SILLYIAVIY 
FGTYPAPAFP LNIAVYAAWA ILLIHIITYY VIKSRFPDRI KKFGDYSL