Gene PICST_30203 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_30203
Symbol
ID	4837627
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	2221181
End bp	2223496
Gene Length	2316 bp
Protein Length	771 aa
Translation table	12
GC content	42%
IMG OID	640388942
Product	predicted protein
Protein accession	XP_001383187
Protein GI	150864397
COG category
COG ID
TIGRFAM ID	[TIGR00727] small oligopeptide transporter, OPT family [TIGR00728] oligopeptide transporters, OPT superfamily

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGATC TTGAGCCGTT AAAGTCTCCA ATCGAGAAGA ATGTCCTGGA TGTGGAGGTC 
GAGGTCTCGG AACCGCTACT TCCTCGAAGA AGTAATGCTG AAACCATAAA ATCGTACAAA 
TCCTATGGTT CGGTTGAGGT GGTCAGTTCT CCGAGTTCTT CAGACGACTC CGAGGATAAC 
GAGGATCTTG ATCCGGACGT CTTAGAATTG CCTAAGATAA TTAGGGAAGC GGTTCCCTTA 
GTGGATGATC CTTCCATTCC AGTTTTGACT TTCAGATACT TTCTTTTGTC GACAGTTTTC 
ATAATCCCTG GAGCCTTTAT AGACACTATG AATTCATACA GAACGACTTC AGCAGCATAC 
TCCATATTTT TTGTACAAAT AGTGTCCCAT TGGGCCGGGA AGTATCTTGC AAGAACACTT 
CCAAGGAAAC AAATCAAGTT CTTCGGATTC AAAATTGACC TAAACCCTGG ACCATGGTCT 
ATCAAGGAAA CAGTCATGGT AACCATCACG GCTAATAGTG GAGCCACCGG TAATTTAGCC 
ACAAATGCTA TCTCTTTAGC TGATTTATAC TTTGGAGAAA AAGTTCCTGC CATTGTGGCT 
GTCGGGTTTA TGTGGGCGAT TGTCTTTGTA GGCTATTCGT ACGCTGCAAT TGCTAAGAAC 
TTTTTGCTCT ACGATCCTCA GTTCTCTTGG CCCCAGGCAC TTATGCAGAC GACGTTGTTG 
CAGTCTCAGG CAAAATCTGA CAAGTCAAGT AGAGGTGGTT CTAAGCAGAT GAGAGTATTC 
TTCACAGTAC TTTTAGGGGT GACGGCATGG CAGTTCTTTC CAGAATTTCT TTTCCCAATG 
ACGTCTTCGT TGGCTATTTT ATGTTGGATA GCTCCATATA ATGAAACGGT GAACTTCATA 
GGCTCTGGTT TGGGTGGAAT GGGAGTACTC AACTTTTCTT TGGATTGGGC CAATATTACC 
TCGTCGATTA TGTTGTATCC TTACTGGATA CAGGTCATTC AGTTCATAGC CTTTGTCATT 
GGAGCCTGGA TTCTTATTCC TTTGGTTAAA TGGGGTGGAA TTGGATCTTT CAAAGGAGGT 
TTAATGTCGA ACAGCCTTTT CCAAGGGAAT GGCTTACCTT ACCCCACAAA TGAGCTTTTG 
ACCCAAGATT TGAAGTTGAA CTTAACTGCC TATGAACAAT TTGGTCCCAT CCATTTAGGA 
GCCCAAAGAG CATGGAATAT GTTCTTTGAC TACGCTGCTT ACGTTAGTGG TACAACATGG 
GTTGTACTCT TTGGATACGA CAAATTCAAA TCGTCTTTCA AGCATTTAAT CACCAGAGAT 
AAAGATACCA AAGTTCAGTA CACAGATAGA TTAAATAAAT TGCGAGCTAG ATATGAAGAA 
GTTCCAATCT ACTGGTATTT GGTGCTATTC CTTATTTCCT TCACCGTCTT GATGTCTATC 
TTCCTCAATG GATACATGTT CATGCCATGG TGGGCTGCCA TCGTAGCCTT AGTCATGGGT 
TCTATCATCG TTACCCCATT GGCCTGGCTT TATGCCTTGT CCAACTTCCA GTTGGCTATA 
GGTACATTCA ACGAGCTTGT ATACGGATAC ATGGTTCAGA ACTTGGAACT GAAGCATCCT 
GCTGGAGCCT TAGTTTTCGG CTCAATTGCT GGCAATGCCT GGTATAGAGC CCAATACCAT 
CTTGAATGTA TGAGATTGGG ATTCTACAAC CACTTACCAC CTCGGGCCGT GTTTTTCTCT 
CAATTGTATG GTGAAATGAT TGGGGTTCCC ATCAACTATT TGGCTGTTAG ATGGGTGTTG 
AGTACCAAGA GAGAATTTCT CAATGGCTCT AAGATTGATC CTTTGCATCA ATGGACTGGC 
CAAACAATAA CCTCGAATCA TACCAATGCT ATTCAGTATG TGGTTTTGGG CCCTTCCAGA 
TTATTTGAAA ATTACCCTCT TTTACCCTAT GGTTTTGTTT TGGGATTAGT GGCTCCATTC 
ATCTTCTTCA AGTTGCATCA AAGGTACCCC AACCTGAACT GGAACCTCTG GAACACCACT 
GTGTTCTTTT CTAGCATGAG TAGATTTTAT GGAAATATTT CCACAGGATA CTTCTCCAGA 
TTTATAGGAG GCACTATTTC AATGTACTGG GGAGTCAGGT ATAAGCACGC CTTGTGGAAG 
AAGTATAACT ATCTTTTGGC AGCTGCTTTT GACACTGGTT ATAATTTGGC AATCTTGCTC 
ATATTCTTGA TCTTTTCCGT GGGAACAAGT TACAACATGC CCAACTGGTG GGGCAACAAT 
GCCACCAGCA TCGAAAGATG TTTTGCATTA TTTTAG

Protein sequence

MADLEPLKSP IEKNVSDVEV EVSEPLLPRR SNAETIKSYK SYGSVEVVSS PSSSDDSEDN 
EDLDPDVLEL PKIIREAVPL VDDPSIPVLT FRYFLLSTVF IIPGAFIDTM NSYRTTSAAY 
SIFFVQIVSH WAGKYLARTL PRKQIKFFGF KIDLNPGPWS IKETVMVTIT ANSGATGNLA 
TNAISLADLY FGEKVPAIVA VGFMWAIVFV GYSYAAIAKN FLLYDPQFSW PQALMQTTLL 
QSQAKSDKSS RGGSKQMRVF FTVLLGVTAW QFFPEFLFPM TSSLAILCWI APYNETVNFI 
GSGLGGMGVL NFSLDWANIT SSIMLYPYWI QVIQFIAFVI GAWILIPLVK WGGIGSFKGG 
LMSNSLFQGN GLPYPTNELL TQDLKLNLTA YEQFGPIHLG AQRAWNMFFD YAAYVSGTTW 
VVLFGYDKFK SSFKHLITRD KDTKVQYTDR LNKLRARYEE VPIYWYLVLF LISFTVLMSI 
FLNGYMFMPW WAAIVALVMG SIIVTPLAWL YALSNFQLAI GTFNELVYGY MVQNLESKHP 
AGALVFGSIA GNAWYRAQYH LECMRLGFYN HLPPRAVFFS QLYGEMIGVP INYLAVRWVL 
STKREFLNGS KIDPLHQWTG QTITSNHTNA IQYVVLGPSR LFENYPLLPY GFVLGLVAPF 
IFFKLHQRYP NSNWNLWNTT VFFSSMSRFY GNISTGYFSR FIGGTISMYW GVRYKHALWK 
KYNYLLAAAF DTGYNLAILL IFLIFSVGTS YNMPNWWGNN ATSIERCFAL F