Gene PICST_42420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_42420
Symbol
ID	4837567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	853175
End bp	854281
Gene Length	1107 bp
Protein Length	368 aa
Translation table	12
GC content	42%
IMG OID	640388882
Product	predicted protein
Protein accession	XP_001382937
Protein GI	150864205
COG category	[R] General function prediction only
COG ID	[COG1163] Predicted GTPase
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.257266
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.210698
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTATCC TTGAGAAGAT CGCTCAGATC GAACAGGAGT TGGCGAGAAC TCAAAAGAAC 
AAAGCAACTG AGTACCATAT TGGTCTTTTG AAAGGGAAAC TTGCCAGATA CAGAAGAGAA 
CTTTTAGAAC CACAACCAGG ACAAGGTGGT GGTGGAGGAG GTCAAGGATT TGAAGTTGCT 
AAAGCTGGTG ATGCCCGTGT TTCGTTAATT GGGTTTCCCT CGGTAGGAAA ATCTTCTTTT 
TTGTCGAAAG TGACCAACAC AAAGTCAGAG GCTGCGAACT ATGAGTTCAC AACTTTGACA 
TCTGTAGGAG GAATTCTTGA GTACAATGGT GCTGAGGTAC AAATTGTAGA TTTACCTGGT 
ATTATCAAAG CTGCTGCCAA AGGTAAAGGT AGAGGTAGAC AAGTCATTGC CGTTTCTAGA 
ACGTCGGACT TGATTATGAT GGTATTGGAT GCTACCAAAG GTGGTGACCA GAGACTGATT 
TTGGAGAATG AATTGGAATC TATGGGAATT AGATTGAATA AGCAAAAGCC CAATATTTCT 
CTCAAGTATA AGAAGACTGG TGGAGTCAAG ATGAACCTGA TAACGCCTCC CAAGTATTTG 
GATGAAAAAC TTGTGTCGTC CATATTGAAA GACTACAAGA TCCACAATGC GGATGTACTC 
ATCCGAGACG AAAATGTGAC TATTGACGAT TTTATCGATG TGATTAACGA GCAGCATATT 
TCGTATATCA AGTGTCTTTA TGTGTACAAC AAAATCGATG CTGTGTCGTT GGAAGAGTGT 
GACCGTTTGG CCAGAGAACC CAACACTGTG GTGATGTCGT GTGAACTAGA TCTCGGAATT 
GAGGATCTCA AGGAAGAAAT ATGGAGAAAG TTGGATCTTC TCAGATTGTA TACCAAGAGA 
AGAGGTGTGG AGCCTAACTT AGATGATCCC ATGGTTGTCA GAAGCAATTC AACTGTCAAG 
GAAGTCTGTG ACGCCATTCA CAGAGACATG AAGAATCAGT TCAAGTATGC CAATGTCTGG 
GGATCCAGTG CTAAGCATTC ACCACAGAAG TGTGGATTGA GCCATCCTGT TAACGACGAA 
GATGTAGTGG AGATAGTCAC GAAGTAA

Protein sequence

MGILEKIAQI EQELARTQKN KATEYHIGLL KGKLARYRRE LLEPQPGQGG GGGGQGFEVA 
KAGDARVSLI GFPSVGKSSF LSKVTNTKSE AANYEFTTLT SVGGILEYNG AEVQIVDLPG 
IIKAAAKGKG RGRQVIAVSR TSDLIMMVLD ATKGGDQRSI LENELESMGI RLNKQKPNIS 
LKYKKTGGVK MNSITPPKYL DEKLVSSILK DYKIHNADVL IRDENVTIDD FIDVINEQHI 
SYIKCLYVYN KIDAVSLEEC DRLAREPNTV VMSCELDLGI EDLKEEIWRK LDLLRLYTKR 
RGVEPNLDDP MVVRSNSTVK EVCDAIHRDM KNQFKYANVW GSSAKHSPQK CGLSHPVNDE 
DVVEIVTK