Gene PICST_21178 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_21178
Symbol
ID	4839094
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	+
Start bp	1596282
End bp	1597442
Gene Length	1161 bp
Protein Length	261 aa
Translation table	12
GC content	42%
IMG OID	640390409
Product	predicted protein
Protein accession	XP_001385001
Protein GI	150865680
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.132821
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTTTG AGATCAATTG GGAGAACCTC ACTTCTGACA GCTCGATTAA CGAGTCGCTC 
AAAGAGTTTC TCGATCGCCA ATTCCAGAAT ATTTCACTCC CTTCGTATAT AGCTAATCTA 
TCAGTGACCA ACTTCTCAGT TGGCGATATT CCACCAGAGA TCACCATACG ACACATTGGA 
GACCCGTTTG ACGAGTTTTA TGAAGACGAA AACGACGAAG GGCTGAGCGG TCCAGAACGC 
GTCTCTTCCA ATTCGAATAT GAACACAAAA GAGACTAACT ACATGTCTAG TGATGATGAA 
GACGACGATG AGGATAATGA TCTTTCAACT ATAGCAGAGG ATTCACACCT CAACAGTTTT 
AGTCATAGCA GCACACTTTA CCATTCACAC GAGCAAAGTC CTCCTCCGGG ACCAGCCCCA 
ACTCCGCCCC TTCTTCTGCG TTCTAGAACA TCACTGGATC CCATTTCATA CATTATGGCC 
AACACTAGTC TCAACTACTT ACACAACTAT AATATCAACA ATATTGGATT GGGACATGCT 
CCTAGCGGAA CTGAGACACC GACAACTATT CTCAATCAAA ATGCCTTGAC CAACGCCAAA 
AATTCAAGAG TCATATCCAG TCTTCAAAAA ACTACCAGAG GAGAAAATGA CATACAAATC 
ATAGCCGAAA TAGAATATAG TGGCAATCTC CATGTAGACT TGATAGTGAA TCTTTTGGTA 
AACTACCCTT CTCCTAACTT CATTTCGTTG CCTATCAAGT TGCACATTAC TGATATTGTC 
ATACATTCGA TTGCTACTAT TGCCTACTTG AAGAAGGCGG TGTACTTTTC ATTTCTCTGT 
GACATCAACG AATCTACACC AGACTACTTT TCCACTTCTT CGTCCAGCTC TGTCTCGACT 
TCTACTGCAG CACCAGCTAC ACCAACGACA TATAATTCTG GTGGGAATTT TGTCGATTAT 
ATTGCTGATC CCAACAACCG TGAGAGAATC GATATCGTAA AGAAGATCAA AATCGAGTCG 
GAGATAGGAG AACTCGAGAA CAACGTCTTG AGGAATGTTG GTAAAGTAGA AAAGTTTCTT 
ATTGAACAGC TAAGAAATAT CATTCGTGAA GAATTGGCAT GGCCTAGTTG GATTTGTATA 
GACATGAGTG AAGATGAAGA C

Protein sequence

MSFEINWENL TSDSSINESL KEFLDRQFQN ISLPSYIANL SVTNFSVGDI PPEITIRHIG 
DPFDEFYEDE NDEGSSGPER VSSNSNMNTK ETNYMSSDDE DDDEDNDLST IAEDSHLNRE 
NDIQIIAEIE YSGNLHVDLI VNLLVNYPSP NFISLPIKLH ITDIVIHSIA TIAYLKKAVY 
FSFLCDINES TPDYFSTSSS SSRIDIVKKI KIESEIGELE NNVLRNVGKV EKFLIEQLRN 
IIREELAWPS WICIDMSEDE D