Gene PICST_31835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31835
Symbol
ID	4838765
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	1797158
End bp	1798561
Gene Length	1404 bp
Protein Length	467 aa
Translation table	12
GC content	40%
IMG OID	640390080
Product	predicted protein
Protein accession	XP_001384656
Protein GI	126136264
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGTTTA TAGTAGAAAT TTGGAGAAGA CCCATATCCC AGGTGATTTT GGTTGGTTGT 
GTGCTATTCA CGCAACCAGG AATGTTCGAT GCCATAACAG CAATAGGTGC CGGTGGCCAG 
AAGGCTACTC TTTCGTGGCT AACAAATCAG GCCCTTGCTA CCTTGTACGG ATGCTTTGCT 
GTAGTCGGTT TCATGGGAGG ATCATTTGTC AACACATTAG GTACAAGGAT TACCTTCTTC 
CTTGGGACCA TAGGTTACAC ATTGTATATC GGCTCCTTGT GGTGTCTTGA TGAAACGGGA 
AACACTGGAT TTGTTGTTGC TGGAGGAGCA TTGTGTGGAA TATCAGCTGG TCTATTATGG 
TCTGTGCATG GTATGGTTAT TATGTCTTAC CCAGAAGAAA AAGACAAGGC AAAATGTTTT 
GCGTTGACTT GGAGTTTACT ATCTGTAGGG GCTACTCTTG GTGGGTTGAT CAGTTTATTA 
CAAAATGCTC AGCATGCAGA TACTTCAGGT GTTGCTACAG GAACATATGT TGCATTCATG 
TGTATTATGC TTGTGGGATT GCTCATTTCT CTTTTGTTAT TGAATCCAAA AGACATTCGC 
AGAAGTGATG GATCTAAATT GGAAAATTTC AAACAGACTT CATTCAAAAG AGAAATTGTA 
GATACTTGCA AGCTTTTAGG GGATTCACGT TTGGTGATGT TGTTCCCAGC ATTCTTTGCT 
AGTAATTTCT TCTATTCGTA TCAATTTGGT ATCAATGCTT TCTACTTCTC TCTTAGGACT 
AGATCTTTGA ATTCTATGGT ATATTGGCTA ACTCAGATTA TCGGCACATT TGGACTTGGT 
CTAATTCTCG ACAATACTAA GCTTGAAAGA AAGCAAAGAG GAATAATTGG CCTTGCTGTT 
ACTTGTGTTG TTGTTATCGC AACTTGGATT GGTGGTGCTG TTTTCCAAAC TCAATTTACA 
AGGTCTTCTT CGCCTCCAAA TGTTGACTGG ACTGATTCAA ATTTCGGTGG TCCATTTGTA 
CTATATTTCA TGTATGGAAT TTCAGATGCT ATGTGGCAAT GCTGGTGTTA TTGGATAATG 
GGCTCCTTAT CGAACGAATC GTATAAACTT GCTCGTTATG CTGGGTTTTA CAAAGGTGTT 
CAATCGGCAG GTTCTGCTAT CTCTTTTGGA TTAGATTCCT TGCAAATACC CTTTAATAGA 
GAATTGGGAG CAAATTTTGG TATGACTCTC TTTAGTATGC CATTCATGCT TTATGTTGCC 
ACAAAGTTGA CTAAGACCAA CTATGATCAA GAGCAAGAAG TTATACCACC AGCACATGTT 
CAAGAGGAGC TTGGTGTTGA AGGTGCTCGT GATTCACAAA GTAGTGTAAT TCTTATTGAA 
GAAATTAATA CACTAAAGGT ATAG

Protein sequence

MKFIVEIWRR PISQVILVGC VLFTQPGMFD AITAIGAGGQ KATLSWLTNQ ALATLYGCFA 
VVGFMGGSFV NTLGTRITFF LGTIGYTLYI GSLWCLDETG NTGFVVAGGA LCGISAGLLW 
SVHGMVIMSY PEEKDKAKCF ALTWSLLSVG ATLGGLISLL QNAQHADTSG VATGTYVAFM 
CIMLVGLLIS LLLLNPKDIR RSDGSKLENF KQTSFKREIV DTCKLLGDSR LVMLFPAFFA 
SNFFYSYQFG INAFYFSLRT RSLNSMVYWL TQIIGTFGLG LILDNTKLER KQRGIIGLAV 
TCVVVIATWI GGAVFQTQFT RSSSPPNVDW TDSNFGGPFV LYFMYGISDA MWQCWCYWIM 
GSLSNESYKL ARYAGFYKGV QSAGSAISFG LDSLQIPFNR ELGANFGMTL FSMPFMLYVA 
TKLTKTNYDQ EQEVIPPAHV QEELGVEGAR DSQSSVILIE EINTLKV