Gene PICST_29686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_29686
Symbol
ID	4836869
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	872114
End bp	873478
Gene Length	1365 bp
Protein Length	454 aa
Translation table	12
GC content	41%
IMG OID	640388184
Product	predicted protein
Protein accession	XP_001382939
Protein GI	150864207
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCGCG AAAAAGCGAC TTGGGAAGCA CTACTCAAGC ATCCCTTATA TACTTGTTTG 
TCTGACATAC CTCCAGACCT CGACCAGTTT ACCTGGGACG AGATTGATTT TGTGCTAGCG 
ACTTTGGACC GTGTCATCGG CCCAATTGCA CGTCTTCCTG TGCCCAGCAA GCATCTTCCC 
GTGTACCTCC AGTTCTGTGA TGGCTGGAAC GAGATCTGTG AACAGTCCCG GGAACTCTAC 
TTGGTTCATG ACATGCATAC CGAGAATGAA GAACTCAAGC TGCTTAACAC AGGTGACTTT 
GATGAAAGCG AAAAGAGAAT ATACGGCACT ATTAACAAGA ACGTGACTTT ATGGTTGAGA 
TTTCATTTGA ATTTGGATGA ATCCTACAAG AACGTCTACG AGTGTATTAA GTTCGCTACC 
CAGAAAGCAG AAATCGAAGA TAGAAGAATC AAAAATAACA TGAGTCTAGA AGATGATCGC 
AACGGTTTTA GGCTCGAAGA GTTGGCACAG TTCTTGCAGG TCTCAGTGAA GATGGAAGCT 
TGGATATACC TGCTTCCAAA GATTACTTAT GAAGACGAGT ACACCACTAA CAACTATGAT 
ATCGATTACT CTCTAAGCTA CATGGCATGG AAACAATTGT GTGAACAATG TCCGATTCTC 
GACAAGTTAT GTTTAATAGA TTGCCACAAT GTAGAAATCA GAACAAAGAC CCGAGAAAGT 
GTAACGGAAA GAGAGTTTTA CATGATGAAG AGAATTTCAG AAAAAGTCAT TCATGTGTTG 
AAGATGCGGT TGGGCCTTGA CAAATTTTGC GACACCATTT ATGAGTGCAT TAAGTTCATA 
AAAGACAGAG TAGACGGATC TTGTAAGTAC CAGCAGATTG AACTTCCAGA GGAGCTTTCC 
GACCAGATAT CAGCTCAACA ACGTCATTAC ATTAGGCATA TGGTTATCTA CACCAATGAA 
TTCTTAGACA AGCTTCCAGA TATTACTCCA GAGAGCCAGG AGTATGTACC ATTGCTTCAG 
GGCTGGACAT ACCTCTGTGA AAGGAACCCT ACCTTGTACA CCATGGTTGG CATGAATAGT 
GAAGACGACA GATTGAAAAA AATAGCCAAC GGCATCTTGT CTGGTAAAGA CCTTGAGATA 
CTCAAGACTA TAGACGCCAT CTTGGCCAGA GACTTCCAGA AAAAGCTTGG TTTAGATTTG 
AAGTTTAAAA ATCTATTTGA ATGTCAGCAG TACTTGGAAG AGAAATGTCT GGAAAAACTC 
ATAGAACAGA AGAAGGAACT TAATACAGGG ACTCAGAAAC AGATTAAAGA AGCACGACCT 
ATGATTAAAG AAATATTTGA AAGCAAAGAC GTATCAACAT TATAA

Protein sequence

MRREKATWEA LLKHPLYTCL SDIPPDLDQF TWDEIDFVLA TLDRVIGPIA RLPVPSKHLP 
VYLQFCDGWN EICEQSRELY LVHDMHTENE ELKSLNTGDF DESEKRIYGT INKNVTLWLR 
FHLNLDESYK NVYECIKFAT QKAEIEDRRI KNNMSLEDDR NGFRLEELAQ FLQVSVKMEA 
WIYSLPKITY EDEYTTNNYD IDYSLSYMAW KQLCEQCPIL DKLCLIDCHN VEIRTKTRES 
VTEREFYMMK RISEKVIHVL KMRLGLDKFC DTIYECIKFI KDRVDGSCKY QQIELPEELS 
DQISAQQRHY IRHMVIYTNE FLDKLPDITP ESQEYVPLLQ GWTYLCERNP TLYTMVGMNS 
EDDRLKKIAN GILSGKDLEI LKTIDAILAR DFQKKLGLDL KFKNLFECQQ YLEEKCSEKL 
IEQKKELNTG TQKQIKEARP MIKEIFESKD VSTL