Gene PICST_33418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33418
Symbol
ID	4840441
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	-
Start bp	589050
End bp	590234
Gene Length	1185 bp
Protein Length	394 aa
Translation table	12
GC content	41%
IMG OID	640391756
Product	predicted protein
Protein accession	XP_001386308
Protein GI	150866642
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.265783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATTA TACGACGACT CCTTTCTACT TCCAATTGGA AACCACCAGA GTCATATTTT 
TCTCATTCTC CACTTAACTA TGAGTCGTAC TCAAGAAGAT TGAAAGGTGC AATCCACTAC 
ATCGCTCAGA ATGGAAGATT CACGGAAAGT ATTCTTATAG ATTGTATCAG AGCCAATAGA 
CAGTTACAAC AGCAGAACTG GAATTCGAGC CCAATAATCC AGAAGACAAG ATCCAGAAAC 
GACTTTCTCA ATCTCAAATT GAGTCCCAGC AATAGTACAC TTGAAGATGA ACTATTCAGT 
TTTGTATTCA ACAGACACCA AGAACGTTCG TCGAGTCCTG AAATTGTCCG CTCATATCTA 
ATTACTGAAC CTCTCCCTTC CAATACTGCG CGAGTTATAG ACGTAGGAGT GAAAGGGTTT 
GAATACAGTT TTTTGAAGCA GAAAGTTGAA CCTTCATTGG TTTTCACAGC TTTGCGGTTG 
TTGTTAGACA GAAAAGATTA CCAAAATAGT TTCAAATTGA TAGACTCTAC ATTCAACTGC 
GACGCCTACA AGGAGCTACA AAGACATCAA ATTGGTAGAA ACTTGTTTGG TTGGTTTCTG 
TACATTGCAG TAGCAACTGT AGTACAAGCA ATATTATTTC CTTTGGTTTC AATATTGGCC 
CTCTTCTCGG TGAATACAGC AACTGCTGGC ATTTTGATGT ACGGACTTCT AAGGTTAGAC 
ACGGCTGAAA ATTTGGGTAG AATCAGCTGG AGACCCTACG TCTCAATGCT CTACAAATTT 
ACACATCGCG ATGAATTGCT TGCAATAAAT ACTGTTATCA CTCATTTCGA AGAACATAAC 
GAAGTGAATA TCAAAAACTA CCACCACAGC CGAGTTCGCA AGCTCTCTAA CCTAAAGTTG 
TTTGACCAGG ACGAGTATGT TTTGGAGCTA CCTAACGACA GTGTAGAACT CGCATCTGTA 
GAGTATAGTG GACAGACATT CCAAGAGGAA AAGGGTATAG TTGAACTTCA GCAGTACTTC 
AAACACGAGT TGAACAGCCG GAAGATGGTC TTCAACGATT TGCCGGAGGA GTTGATTTTC 
CTCGAGTTCT GGTTTACCCA CGGTGAAAAT TTCGAGTGGG TAGAGCCAGA TCAGGATCCG 
GCAGAGATCA TAAAGTTAGA TATCCAAAAC CAGAAAACCG ATTAA

Protein sequence

MTIIRRLLST SNWKPPESYF SHSPLNYESY SRRLKGAIHY IAQNGRFTES ILIDCIRANR 
QLQQQNWNSS PIIQKTRSRN DFLNLKLSPS NSTLEDELFS FVFNRHQERS SSPEIVRSYL 
ITEPLPSNTA RVIDVGVKGF EYSFLKQKVE PSLVFTALRL LLDRKDYQNS FKLIDSTFNC 
DAYKELQRHQ IGRNLFGWFS YIAVATVVQA ILFPLVSILA LFSVNTATAG ILMYGLLRLD 
TAENLGRISW RPYVSMLYKF THRDELLAIN TVITHFEEHN EVNIKNYHHS RVRKLSNLKL 
FDQDEYVLEL PNDSVELASV EYSGQTFQEE KGIVELQQYF KHELNSRKMV FNDLPEELIF 
LEFWFTHGEN FEWVEPDQDP AEIIKLDIQN QKTD