Gene PICST_5333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_5333
Symbol
ID	4851849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	3002081
End bp	3003187
Gene Length	1107 bp
Protein Length	369 aa
Translation table
GC content	43%
IMG OID	640393557
Product	predicted protein
Protein accession	XP_001387141
Protein GI	126275780
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.684837
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GATCCAAAAG TATTTGCTCC AAAGGCAGTA GCAAACCCAC CAGCAGAACT TGGCTTTAGA 
TTGAAGCTAA TAGTACAACT TGTAAAGGCT TATAGACAGC ACCATCCTGA TATCCAAACT 
CCTATAACAC GGGCCATAGA GGAAGAATAC AAAGTAGCTA AAGTTTCATC TAGAACGACT 
TACTCAGCAT CGATCAAGAA AGTGATCTAT GCGGCTCTTC ATCCAGAGAA AGCTAAGACG 
CCCAAGGAGA ACGGGCCCAC AGAAGAGCAA TACAAAAGGC TATTGTCCGA ACTCGTCATC 
CCCGTGGAGA AACTTGAGAA GTTCGGCTTT ATAATGAGAT CTCCAGAGAC TATTACTCCA 
AGTAGAATTC GCACATGCCA TAGATGTGGT GCGGAGTTCA CCCGTGACGA ACAGCTTCTG 
CCGGTTCAAT GTCAGTACCA TGCGGGCAGG GTGAGAAAGA CAGATTTTGG CAGAGTTTAC 
GAATGCTGTC AGTCCGAAGT CAGTCTGGGT GATACCCATC CGTGTACAGT ATCCAATATG 
CATGTGTTTT ACTGGCAGAA TAAGGAAGAA ATGGAGTGGT CTATTCCTTT CCAGAATACA 
GATAGACTCT TTGGTGAGAG TAAAGGGTCC TTATTTGCAA TTGGTATAGA TTGTGAGATG 
GGGTACACCA CCAGAGGACT GGAGCTCTTG AGAGTGACAG CAGTAGACTT CTTCTCTGGC 
AAAGACGTTT TGGATATCTT TGTAAGACCG TACGGAGAAG TAGTAGACTT AAATACGCGT 
TATTCTGGTG TATCTGAAAT AAAGCCCGAG GCAGTATCTT TCCATGAGAT GCTCAATCAA 
TTGGGCCATA TCATGGACAA GAACACGATT CTAGTCGGCC ATGGACTTGA GAACGATATG 
AATGCCATGA GACTTATCCA TAATAGAATT ATCGATACGT CTATCTTGTA TCCTAAACAC 
AAGGCCACTC CTACCTTCAA ATTCAGTTTA AAAGACCTCG CATTCCAGTA TCTCAGCCGT 
GTAATCCAAA CAGGAGAACA CGACAGTAGT GAAGATTCGC TAGCAGCCAT TGACATTGTA 
AAATATTTTA TCAAAAAGGA TATTCAG

Protein sequence

DPKVFAPKAV ANPPAELGFR LKLIVQLVKA YRQHHPDIQT PITRAIEEEY KVAKVSSRTT 
YSASIKKVIY AALHPEKAKT PKENGPTEEQ YKRLLSELVI PVEKLEKFGF IMRSPETITP 
SRIRTCHRCG AEFTRDEQLL PVQCQYHAGR VRKTDFGRVY ECCQSEVSLG DTHPCTVSNM 
HVFYWQNKEE MEWSIPFQNT DRLFGESKGS LFAIGIDCEM GYTTRGLELL RVTAVDFFSG 
KDVLDIFVRP YGEVVDLNTR YSGVSEIKPE AVSFHEMLNQ LGHIMDKNTI LVGHGLENDM 
NAMRLIHNRI IDTSILYPKH KATPTFKFSL KDLAFQYLSR VIQTGEHDSS EDSLAAIDIV 
KYFIKKDIQ