Gene PICST_81383 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_81383
Symbol
ID	4837236
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	2246870
End bp	2249500
Gene Length	2631 bp
Protein Length	630 aa
Translation table	12
GC content	41%
IMG OID	640388551
Product	predicted protein
Protein accession	XP_001383189
Protein GI	150864399
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.184243
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.358909
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CAACAGTCAG TGCTTGCTCA TTTCATCTGC CACAGCCATA CACACTCAAC CCCGTGACTT 
CTGGTGAAGC GTAGTATCCA TAGAATAGCA ATATTGTTCG TTTCATCTGC TTCATAGAAC 
CAATCTACAC AGATCACCCA ACACCACTGC CACTACCAAT AAACATCCAC CTACATTGCT 
ACTGATTGCA CACGATCTCG CCATCTTTTT GTTATTGATA CTGTTCTCAT TGTAATTGTT 
GTGATTGAAA TTGGAGTCTT ATCGTAATTG TTATTAATTG TTTTGTTGTA GTTTTCATTT 
TTCAATCTCA GTTCAAATCA TTCAAATCAT CAATAATAAA TTCAATTTAA GTTTTCACAG 
AACTGAATAT CATAGTCTTC ATTAGCTGAC CATCATCATA ATTATCATAA TTCACATTAC 
ATAATGGACA ACTACAACGA CGACTTGTAT CCTTTGGCAT TGCTCATGGA CGAGTTGAAA 
CATGACGATG TGTCCAACCG TGTGGAAGCC ATGCAGAAAT TGGACAATAT CGCCATCGCT 
TTGGGCCCTG AACGGACGCT CAAGGAATTG TTGCCCTTTT TAAACGACGT AGCCCAGGAC 
GATGAGGAAG AAGTCTTTGC TGTATTGGCT TCAAAGCTTG GAGACTTTGT CCCGCTTGTA 
GGGGGCCACG AGAACTGTGA ACCATTAATT CAGATCTTAA CCATTCTCGC ATCGATGGAA 
GAACCCATTG TCAGAGATAA AGCCATCGAC TCATTGTACA AGATCAGTTT AGAGTTGACT 
CTCGACGAGT TGACCGGTAT ATTCTTGACA TTGATTCGTA GCTTAAGTCA AGGTAATTGG 
TTTTCTAAGA AGGTAGCCAG TTGTGGTTTG TACAAAGCTG TAATTCTCAA GGTAAACTCT 
TCTGCAAGAA GGGATTTGTT GAATTTGTAC TTGAAATTGG TTACTGACGA CTACCCCATG 
GTCAGGAGAG CGGCAGCCAA CAACTTACCT CATCTCATCA ACCTTCTCAC GGAATTCACC 
GAAGAAAAAC CCAACGACGT CAACAAGATC AACAACGAAG ACTGGGAAAT AATCTCGAAG 
ATGTTCCAGC ACCTCATCAA TGACGACCAG GACTCGGTCA AATTCTTAAG TATTGATGTT 
TTGATTGCCA TTCTTGAGTT CTTCCAAAAG ATCAACGAAT ACAGCTTCAA CTCCGACTTT 
TTGACCAGCG CTTTGAAGTT GATCAAGGAT GAAAGTTGGA GAGTGCGTTA CACTGCTGCT 
GACCGTTTCA CCAAGATCGC CAAAAACTTC ACCAATGAAG AAAGTGACTT GTTCCAGTTG 
ATCGATCCTT TTATCTCGTT GATGAAAGAC AATGAGGGTG AAGTAAGAAA AGCTATCGCT 
AAGCAATTGC CTAGTTTCTG TGAGCTTTTG ACCAAATACC AATCCACTAG AGCCACTATT 
CTCTCTAAGA TCATCCCTGT AGTGAACGAG TTGAGCCAGG ACTCCCAAGA TAACGTCAGA 
GCCTCGTTGG CATCCACCAT CACAGGCTTG TCGCCCATCT TAGAGAAGCA ATCCACCATA 
GATAAGCTTT TGCCCATTTT CTTAGTAATG TTGAAGGACG AGTTCCCAGA CGTGAGATTG 
AACATCATCT CCAACTTGTC TGTTGTGGAT GAAACCATTG GTATCAACCT CTTGTCGACA 
AACTTGTTGC CTGCCATTAC TGAGTTGGCT CAAGACTACA AGTGGAGAGT CAGATTGGCC 
ATCATCGAAT ACATTCCCAA GTTGGCTAAA CAGCTTGGTG AGTCTTTCTT CAACGATGAG 
TTGTTGTCGT TGTGCATGTC GTGGTTGTGG GATCCCGTAT TTGCCATTCG TGATGCTGCC 
GTCAACAACT TGAAGGATTT GACCATCATC TTTGGTTCAG ATTGGGCCAA CAACGAAATC 
ATCACTCGCT TGTTGAATAA CGGCGACAAG ATTGACGAAG ACGACAAGAT CGACTACTCT 
AACTTCATCA TCAGAATAAC ATGCCTATTT GCCATCACCA AGTTGATTCC CGTCGTCGAC 
TACCAAATAA TAGTGAAGAA GGTATTGCCC TTCATCAACA GTTTAATCAC AGACGCTGTG 
CCCAACATAA GATTCAACGT AGCCAAGTCG TACCTCATAT TGGTGGAGAC ATTTGTACGC 
AACAAGAGCA AGTTGCCCAT CAAGGACGAA GAGTTGAAAA AGTTGATCAA CTTGGAAATT 
CTTGCTAACT TAGAAAAGTT GCTGAACGAC ACTGATGTTG ACGTCAGATT CTACGCTAGC 
AAAAGTATTC AGGGTATCCA AGACTTGTTG AACTAAAGTA GTACGACGTA AAAGAAAAGA 
ACGAGAAACG AATCACTCCT TACATGATAT TATTAAACTA TCTTCCTCAT AAAGTTCATG 
ACTTTTTGTA TTCATTTCAT TTGTTTCTTC ACCTGTTTTT TGTACCCTGT TTGAATAAGT 
ATTATAGTCT TGCTGCTTTC TTATCTGATC ATCCTTTTCT CGGTTAACAG CAACTCATTA 
TATGATAGGT GCATCAATAT TTAATTCAAC GTTGTTAGCT TTCATTTTTA TCATTTCTTT 
GATACTAAGT ATATCGTTTT TGCGTTTAAA TATACATCGA AATTAATCGT G

Protein sequence

MDNYNDDLYP LALLMDELKH DDVSNRVEAM QKLDNIAIAL GPERTLKELL PFLNDVAQDD 
EEEVFAVLAS KLGDFVPLVG GHENCEPLIQ ILTILASMEE PIVRDKAIDS LYKISLELTL 
DELTGIFLTL IRSLSQGNWF SKKVASCGLY KAVILKVNSS ARRDLLNLYL KLVTDDYPMV 
RRAAANNLPH LINLLTEFTE EKPNDVNKIN NEDWEIISKM FQHLINDDQD SVKFLSIDVL 
IAILEFFQKI NEYSFNSDFL TSALKLIKDE SWRVRYTAAD RFTKIAKNFT NEESDLFQLI 
DPFISLMKDN EGEVRKAIAK QLPSFCELLT KYQSTRATIL SKIIPVVNEL SQDSQDNVRA 
SLASTITGLS PILEKQSTID KLLPIFLVML KDEFPDVRLN IISNLSVVDE TIGINLLSTN 
LLPAITELAQ DYKWRVRLAI IEYIPKLAKQ LGESFFNDEL LSLCMSWLWD PVFAIRDAAV 
NNLKDLTIIF GSDWANNEII TRLLNNGDKI DEDDKIDYSN FIIRITCLFA ITKLIPVVDY 
QIIVKKVLPF INSLITDAVP NIRFNVAKSY LILVETFVRN KSKLPIKDEE LKKLINLEIL 
ANLEKLSNDT DVDVRFYASK SIQGIQDLLN