Gene PICST_30719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_30719
Symbol
ID	4838207
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	767354
End bp	768889
Gene Length	1536 bp
Protein Length	511 aa
Translation table	12
GC content	48%
IMG OID	640389522
Product	predicted protein
Protein accession	XP_001383780
Protein GI	150864804
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.119081
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.810962
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCCAC CTCCGGCTTC TGCCGCAACC ACGGCTCCGG AATTGGCCAC AACCCCTGCT 
CCAACCTCGG TTTTGTCCCA GGAAAGAGCC TCCTCTATAG GCTGGTACTT CATCGTATCC 
TACTACGACT TCTACAACAC CAACATCGAG AATATCCACA AGATATACCA CCAAAACGCT 
CTGATTTCTC ACGACTCCTT CCCAGTGGAT TCTGCTAATA CTGCTGAAGA CGAAGTTAAA 
ACCATCCATG CTGCTCATGG CACCGAAGCT ATCAGAACTC GTTTCAAGAA CGATCCAGAG 
TTGAAAGCAA ACAACCGTAT CGTAGTCACT TCGGCCGCGT TTGAAGTTTC GTTGGAGAAG 
AACATCTTGA TTGTCGTATT TGGTGAATGG GCCAAAGAAG ACTCTGTCTA TCACCAATTC 
ACCCAGACCT TCGTCTTGAC TCCAGGTAAG AAGGAAAACT CATTTGATGT AGCCAATGAT 
GTTTTGAGAT TTATCGACTT TGGTGAATTC AAGGCCGTTA AGAAGGAAGA AAAGAAACCT 
GTTCGTAACG GAGAAACCAT TAATGCTTCT GCTACTGCAG CAACTACTAC TGAAGCTTCT 
ACTAGTACTC CCAAGGCTGC TTCTAGTGCC ACTAGTATTT CTGCTAATTC TACGTCAACG 
TCTACTTCGA CTTCTACTGC TGCTCCAACG TCTACTGCTG CTACAACTGT TCCAGTTGCC 
GCTGCAACTC CTACTGTTGC TACTGTTGCT GCTTCTGCTG CTTCTGCCAA CACGACCGCT 
GTTTCCTCTG CTGCTTCTGC CGAGTCTGAA ACCACTTCCG CTTCTTCGGT CCCATCTGAA 
GAGAAACAAA AACCTGAAGC TCCTGTGACT CCAGAACCAG TTGAAAAGTC TGAAACTAAG 
GAATCTACAC AAGAACCAGT GAAGGAATTG TCTCCTACTG ACTCTGTGGC CTCCAAGAAC 
GAAGAAGAGT CTTCTACTGC TGTGACTGCC AAGTCTGCTC CAGGCCAACC TTTGTCTTGG 
GCAGCATTGG CCTCACAGGC CGCTCCTCCT AAGAATAAGC CAGTTGCTGT AGCAAAGTTG 
TCTCCAGCCC CAGCCAAGAA AGCTGCTACA ACCCCTCCAG CTAATGGTAT AGGCAGCAAA 
AAGAAAGAAG AATGGTACCC CATCTACATT CGGGGGATCA GAGAACTCGA TGAGAAATTG 
TTGAGAGATC ACATTTCAAA ACACTTTGGT GAGCTCAAGT ACTTCAAGAC CAATCTGAAC 
ATTGCGCTCT GTGACTTTGT CACCTATGAC GCCCAACACA AGGCCCTTGA AGCTGGTGAA 
ACCATTGTAG ATGGTATCGT CATCCTGTTG GAACCTCGTG AGTCAAAGAC AGGCAACAGT 
TACCACAGCA TCAACAAGAA AAAGGACAAG CCCGCGGGCT CAGCTGTCAC AAATAGCAAA 
CAGTCGCCAC AACAGACTCC ACAACAGAAG GCTGCCAAGG GCGAGAAGAA AGTTGTTGGG 
AAGAAGAGCA ACCGCACTGC TACGCGTAGT GATTAA

Protein sequence

MSPPPASAAT TAPELATTPA PTSVLSQERA SSIGWYFIVS YYDFYNTNIE NIHKIYHQNA 
SISHDSFPVD SANTAEDEVK TIHAAHGTEA IRTRFKNDPE LKANNRIVVT SAAFEVSLEK 
NILIVVFGEW AKEDSVYHQF TQTFVLTPGK KENSFDVAND VLRFIDFGEF KAVKKEEKKP 
VRNGETINAS ATAATTTEAS TSTPKAASSA TSISANSTST STSTSTAAPT STAATTVPVA 
AATPTVATVA ASAASANTTA VSSAASAESE TTSASSVPSE EKQKPEAPVT PEPVEKSETK 
ESTQEPVKEL SPTDSVASKN EEESSTAVTA KSAPGQPLSW AALASQAAPP KNKPVAVAKL 
SPAPAKKAAT TPPANGIGSK KKEEWYPIYI RGIRELDEKL LRDHISKHFG ELKYFKTNSN 
IALCDFVTYD AQHKALEAGE TIVDGIVISL EPRESKTGNS YHSINKKKDK PAGSAVTNSK 
QSPQQTPQQK AAKGEKKVVG KKSNRTATRS D