Gene PICST_30650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_30650
Symbol	MAK32
ID	4837886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	594225
End bp	595286
Gene Length	1062 bp
Protein Length	353 aa
Translation table	12
GC content	42%
IMG OID	640389201
Product	Protein necessary for structural stability of L-A double-stranded RNA-containing particles
Protein accession	XP_001383747
Protein GI	150864776
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0524] Sugar kinases, ribokinase family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0154701
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.395285
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTAACA ACAGCGAAAG TGTTATAGTC ACTTCGATGG GCATGTTCAT CATTGACGAC 
AATATATATC CTCCGTCTTG GAACAGAAAG AACGACACAG ACATTATTGG CGGAGGTGGT 
CCGTATGCCA TTGTAGGAGC TACCATGATA GCAGGACGGG AAAATGGACA CAGGGTCAGT 
GGCATAATCG ATAAGGGTCT GGACTTTCCT AAAAAGGTTG AGGAGCAGTT GAATTCATGG 
CAGTCTGGAG TCATCTTTCG AGAGAACCCA GAAAGACTCA CAACCAGAGG AGTAAACACC 
TATGACGAGA ACCATATCCG TCATTTTTCC TACAAGAATC CCAAGAAACG TATCGAAGTC 
GTTGATATAT TGCAACTGGA TAAATTGTCG ACTTCGCGAT GTTTTCATTT GATTTGCTCT 
ATTGAACGTT GTGAATCGAT CATAGACGAT CTTAACTCTA AACTAGACCA TACTCCAGTT 
TACATATATG AGCCTCTCCC AGACGACTGT ATCTCTACCA ACTTTGACAG GCTCAAACTC 
TTGCTTCCTA AGATTGACAT TTTCACACCC AATCTCGATG AGGCCCAGGC ACTCTTGGGC 
AGATCAGGTT CACTTCCTAG CACATCGGAA AAGCTTAAGG AAGTAGCGTC CCATTTTATG 
CCCTATTTAA AGCTCAAGAA CTCAGGAATT ATCTTGAGAT GTGGTCCACT TGGTTGTTTC 
ATAAATACCA TAGACGACTA CAATGTCTTG TTGCCTGCTT ATCACAGCGA TCAGACAAAG 
GTAGTAGATG TCACTGGAGG TGGAAACTCT TTCTGTGGAG GATGCATAGC AGGATTTTAC 
TTGTCAGGAG GTAACTGGCT AGTAGCAGGA GTAAGTGGAA ATTTGGTCAG TGGGTGTGTT 
ATAGAGAAGT TGGGAATGCC TCTTAGACAG TCTGAAACCA ACAAATGGAA TGGTCTGACA 
GTTTCAGAAA GATTAGACAC TTATTTGAAA AATAATCCTC AGATTATCGA GGTTCAAAAT 
GAACAACTAT TACAGGGTTT GAACGTATTG AAACAAGTAT AG

Protein sequence

MTNNSESVIV TSMGMFIIDD NIYPPSWNRK NDTDIIGGGG PYAIVGATMI AGRENGHRVS 
GIIDKGSDFP KKVEEQLNSW QSGVIFRENP ERLTTRGVNT YDENHIRHFS YKNPKKRIEV 
VDILQSDKLS TSRCFHLICS IERCESIIDD LNSKLDHTPV YIYEPLPDDC ISTNFDRLKL 
LLPKIDIFTP NLDEAQALLG RSGSLPSTSE KLKEVASHFM PYLKLKNSGI ILRCGPLGCF 
INTIDDYNVL LPAYHSDQTK VVDVTGGGNS FCGGCIAGFY LSGGNWLVAG VSGNLVSGCV 
IEKLGMPLRQ SETNKWNGST VSERLDTYLK NNPQIIEVQN EQLLQGLNVL KQV