Gene Ssol_2449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2449
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	2253677
End bp	2255038
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	38%
IMG OID
Product	permease for cytosine/purines uracil thiamine allantoin
Protein accession	ACX92598
Protein GI	261602995
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGGAA AGGAGGAAAT TAGCTCAAAA TACGACGATT ATTCACTGAA GGAAGTTCCT 
AAAGATTCCA GATACGGCTT CTTTAACGTT TTTCTAGTAT TTTCATCTGT ATATGGTGCA 
ATAGCTGTAA TATGGGCTGG AGGAGCACTA GGTTACGGTC TCACATTTTC TCAAGCTATA 
ATTGCAGTAT TGTCGGGAAC AGTAGTATTA GGCATCTTAG GTTCATTGAC TGCAGCTGTG 
GGAGCTTATA GTGGCCTTTC CACTTATGTT ATGTGGAGAC ATCCTTTAGG AAGATGGGGA 
GGTAAAATTG CTGGATTGTT ACTGATAACT ATAACCACGG GAATAGGGTG GTATGCAGTA 
GAAACATGGC TATTTGGTAT AGTAATGAGC GAGATATTCC CAAATAATCC ATTCTTTTCA 
GTTGGGGTAG CTGCGATTTG GGGAGGAATT TTGATGACAA TAATGACATA TGTAGGGTAT 
AGAATGCTGT CTTTCCTAAG TTACTTTACA ATTCCATTTC ATATATGGCT GATAGCAATA 
GGAATAGCAA TAGTGTTAGC ACTAAAAGGG GGATTCCACA CAGTTATGGC TGCTGTCCCA 
ACAAGCCATA TGAGCTTGCT TGACGGTATA TCTGCTACCA TAGGACTATA TAGCGCTGGG 
ACTATAATTT CTCCCGATAT CTCCAGATTT GCCAAATCAG CTAAGGACGC TGGATATGCG 
TGGTTTGCTC ACATTATTTT CCTATATCCA TTCTTAATAT TGGGGGGAGT TGCAATAGTG 
TTAGCAACTG GTTCCTATTT AATAACTAAC GCAATGTTAG AGTTAGGTAT GGGAGTTGGT 
GTTTTACTAA TTATAGTCTT TGGTCAGTTC ATAATAAACA CTGATAATCT ATATAGTGGT 
TCCTTATCTT TAGTTAACCT AATTCCAATG AGGCGTGAAA TCGCCTCTGT GATCAACGGT 
GTCATAGGTA CTGCTATTGC TGCATACGTC GGATTCTCAG CAGGTTCATC CATAACCCCC 
TTTGAGAACT TTATCTCTTT ACTAGGAGAC TTTCTACCAG CAATGGGAGG AATTGTACTA 
GCCGACTTCT ACATTGTGAA GAAATATGTT AATAAAATCC AAGATCCTCA TAAACGGTAT 
GAATTCGTAC CAAATAATAA GTATTACAAT ATAAATATTG CAGGAATATT AGCTCTAGCA 
TTAGGTTCAA TAATAGGTTA CTTCGTAAAT GCAGGTATAC CCGCCATAAA CTCCTTAGTT 
ACTGGCTTCC TATCCTACAT AATAATATAT TACATTATCA AAGCAATGGG TAAGAGTCCA 
GAAATATTGC CGTTTAACTA TGAAGGGGGG ATATTAAGAT GA

Protein sequence

MTGKEEISSK YDDYSLKEVP KDSRYGFFNV FLVFSSVYGA IAVIWAGGAL GYGLTFSQAI 
IAVLSGTVVL GILGSLTAAV GAYSGLSTYV MWRHPLGRWG GKIAGLLLIT ITTGIGWYAV 
ETWLFGIVMS EIFPNNPFFS VGVAAIWGGI LMTIMTYVGY RMLSFLSYFT IPFHIWLIAI 
GIAIVLALKG GFHTVMAAVP TSHMSLLDGI SATIGLYSAG TIISPDISRF AKSAKDAGYA 
WFAHIIFLYP FLILGGVAIV LATGSYLITN AMLELGMGVG VLLIIVFGQF IINTDNLYSG 
SLSLVNLIPM RREIASVING VIGTAIAAYV GFSAGSSITP FENFISLLGD FLPAMGGIVL 
ADFYIVKKYV NKIQDPHKRY EFVPNNKYYN INIAGILALA LGSIIGYFVN AGIPAINSLV 
TGFLSYIIIY YIIKAMGKSP EILPFNYEGG ILR