Gene PICST_32081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_32081
Symbol
ID	4839723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	+
Start bp	638241
End bp	639398
Gene Length	1158 bp
Protein Length	385 aa
Translation table	12
GC content	41%
IMG OID	640391038
Product	predicted protein
Protein accession	XP_001384791
Protein GI	150865534
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.555096
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0738823
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGCCT ATGCAAATCC CCCATTGACA GACGGAGCGA TACGAACGTC ATTGTCTGAT 
GATAATGGGA GTTTTGAGGA CGAAGAATTT GATGACACAG GAATGGAATT TGAGTCTCCA 
AGCAAAGACA TAGTTCAGCT GAAATGTTCT ACAGATGATC GGACTAATGC AGAATTGACC 
AATGGGCCCG AAATCAGCGA ACGCATCTCC TCTTTACCAA AAACTAGGGA GAGTCGTTTA 
ATGTTCCAGG CGAAGAGTAT GACAACACAC AGACGTCAGC CTATGAATTC ATCCTCAAAC 
AGTAATTACT TCGGTTACTC GGACGAAGAG CAGAGAACCA TTATTCGACA GAATGAATTG 
GTTTCTTCTC CGCGAGACAG ACCTAATGGG TTCGCCATTA GGGGAAGGCA ACCTTCTCAT 
TCACATGTTT CACCTTCTTC GAGATTGAAA TTTAACAACA TTTTGGACAC TCTAGCAAGT 
TCTCCTAGCA AAATAAAGAG CAACAATAGA TTGGAGAAGC TGTCTTGGAA CACTGAAAGG 
ATGCCGAATA GTGAAATTGA AGGTGGACGT GATACGAGTC CACAAAAAGC TTCACATGAA 
TTGATCGCCA CAAAATGGAA CACGTCAGTA GATCTGCCAT ATCGTGTAAA AGTCCAGCCT 
ACAAGGCTGA TAATCAATGA TGAAATATCA AGAGATAGTA TTATTGAGAA AGTTAACCTT 
ACGTTGGATT CTCTCAGCAC TTCAATTAGA AAAACGAAGA CGATTAACCC TGATATTACT 
TCTACGCCCA AATCAAATTC TAAGGATATT AAGCTGGCCG CCCCATCGAA CAGTTTACAA 
TCTGAATTTG TCGACCATTT CTTGAGGAGT CCAGAACCCA CGTTGTTCAA GTCTAATTCC 
GGAAAAAACC ATGAATTCGA ATCAAATACT TGCGGAAGCG GTACATGGCC CAGTGATAAA 
TGGTTGAAGT TGCGAAAGAT AGTAAAACTG AGGTCAATTA CAAGACTGGA AGCTATTGGA 
AGTACTTTTC TTCTTCAGGA GCTTGATTGT TCAAAAAAAG AACTTACATT AAGGTATGAC 
TTCTTGCAAC AGCTTCCGAA AAAGAAATCC CGAAGTAAAA GAATGAGTAG AGTAGAAAAG 
GAGACTCTTT ACAAATAG

Protein sequence

MNAYANPPLT DGAIRTSLSD DNGSFEDEEF DDTGMEFESP SKDIVQSKCS TDDRTNAELT 
NGPEISERIS SLPKTRESRL MFQAKSMTTH RRQPMNSSSN SNYFGYSDEE QRTIIRQNEL 
VSSPRDRPNG FAIRGRQPSH SHVSPSSRLK FNNILDTLAS SPSKIKSNNR LEKSSWNTER 
MPNSEIEGGR DTSPQKASHE LIATKWNTSV DSPYRVKVQP TRSIINDEIS RDSIIEKVNL 
TLDSLSTSIR KTKTINPDIT STPKSNSKDI KSAAPSNSLQ SEFVDHFLRS PEPTLFKSNS 
GKNHEFESNT CGSGTWPSDK WLKLRKIVKS RSITRSEAIG STFLLQELDC SKKELTLRYD 
FLQQLPKKKS RSKRMSRVEK ETLYK