Gene Ssol_2375 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ssol_2375
Symbol
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sulfolobus solfataricus 98/2
Kingdom	Archaea
Replicon accession	CP001800
Strand	+
Start bp	2176707
End bp	2177999
Gene Length	1293 bp
Protein Length	430 aa
Translation table	11
GC content	36%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	ACX92539
Protein GI	261602936
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.529747
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTATACG GCCTAAATAA ACAACAATGG CTAGCAGTGT TCTCTACATG GTTAGGATGG 
TTAATGGATG GTTATACTTC TATAGCTTAT GCTCTAGTTG CAGTTACTAT TTCGAAAATA 
TTTTTCCCTT CAACCATAGG AATTCTAGGT TTAATAGCCA CTTTTGGAGG ATTCGCAGTT 
GGTGCATTAG CTAGGCCCGT AGGATCTTTA GTGTTTGGAA ATTTCATAGG AGATAAGATA 
GGTAGGAAAA ATATGTTAGT TCTAACGATT TTAGGTTTTT CCTTAATAGC CTCTTCTAAA 
GCCCTATTAC CTTCATACGA AACCGCGGGA ATTTTAGCTC CACTATTTCT TTACATCATA 
TTATTTGCTG AGGGCATGTT TGCAGGTGCA GAATATGGAG GAGGAACCAC ATTGGCGTTA 
GAGTCTGTAC CTGTAGGCAA GAGAGGATTT ATTGGCTCTT TTGTGCAAAG TGGTTTTGGT 
ACAGGTTATT TCGTAATATC GTTAGTATAC TCAGCTCTGT ATAGTATGTT TGGGAATGAA 
GGATTCCAAA CTTTAGGATG GAGAGTCCTT TTTGCAACTT GCATATTGCC TGGATTAATT 
ACGTTAATAA TTAGAAAAAT GACAGACGAA AGTCCAATCT TTAAGGATAT GAAAAGTGGG 
AATGAAGTGG TCAAGATACC TATAAAGGAG TTGTTCAAAA TGTCTTATTC CTCAGTATTA 
ATAGGGTTAA TGATAACAAG TGGATTGTTA TACATAAACA CTGCTACCTT TTCTTTCTAT 
CCTACAGTGT TGACTATTCA AGGAATACCA GGGACAATTG TGGGATTAAG CGTTGCTATA 
ATAAATTTGG TTTCCCTTTT TGGAGTTTGG TTTGGCGGAT TTCTAGCTGA TGTCATTAAA 
AGGGGAAGAA AAGTTCCAAT GCTAATTTAT TCAATAATAT TCATTTTCAC CGTATACCCA 
GTTTTGTATC TGGGATTGCT AAAGAACGTG TATTTATCCA CTATCGTATT TAGCTTACAA 
GCATTTTTAG AAGCTATGAT ATTCTCCACT TTACCTGCAT TTCTTGCAGA ACAGTTTAGT 
AAAAAATATA GAACTACGGG AGTAGGATTT ACATATAATG GGGGAGCAAT AGGAGGTGGT 
TTTGCTATAT CTGCTACTTT AGCGTTATCA ACGTACTTAG GCTTACTTTA CTCATGGTCG 
ATAAACATTA TTATAGCTGG GATAATAATG ATAATGGGTA TTGTCTTAGC AAAAGAAACT 
TATACTGGAA AAGAAGATCC AATTTTGAGG TGA

Protein sequence

MVYGLNKQQW LAVFSTWLGW LMDGYTSIAY ALVAVTISKI FFPSTIGILG LIATFGGFAV 
GALARPVGSL VFGNFIGDKI GRKNMLVLTI LGFSLIASSK ALLPSYETAG ILAPLFLYII 
LFAEGMFAGA EYGGGTTLAL ESVPVGKRGF IGSFVQSGFG TGYFVISLVY SALYSMFGNE 
GFQTLGWRVL FATCILPGLI TLIIRKMTDE SPIFKDMKSG NEVVKIPIKE LFKMSYSSVL 
IGLMITSGLL YINTATFSFY PTVLTIQGIP GTIVGLSVAI INLVSLFGVW FGGFLADVIK 
RGRKVPMLIY SIIFIFTVYP VLYLGLLKNV YLSTIVFSLQ AFLEAMIFST LPAFLAEQFS 
KKYRTTGVGF TYNGGAIGGG FAISATLALS TYLGLLYSWS INIIIAGIIM IMGIVLAKET 
YTGKEDPILR