Gene PICST_39360 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_39360
Symbol
ID	4851662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	2478983
End bp	2480185
Gene Length	1203 bp
Protein Length	400 aa
Translation table
GC content	47%
IMG OID	640393370
Product	predicted protein
Protein accession	XP_001387047
Protein GI	126275193
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4833] Predicted glycosyl hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTCT CCAACCCTAA CCTTGAAGGG TATAACGTTG TGCGCAACTT TTGGCTCTTG 
TACTACAACA GGAATAAGGG CACTTTTGTA GCACCCAAGA AATGTAGCGG ATGCTACAAT 
GAGGACAGAT TTGTGGTTTG GGCTGTTGCT GTTGCTGTTC AGGCAGTAGT CGATGGTGCC 
CGAATCTATC CAGAATTGCG TCCCTTGATT GCGCCTGGCA TAGATATCTT CAAGAAATAT 
AAGAATCCTC ACCTCAGAGG ATATTCTGCT GCTGAAAATG GTGGAAATGA CAAGGACATC 
TACTATGATG ATGATGCCCA AGTAGCCAGT GCCATGCTTA CTGCGTATGA GGTTACTGGT 
GAAAAGCGTT ACTTGGACCT CGGTAGGGAA TTAGTGCGTT TCCTCATGGG AGGATGGAAC 
ACCAATCCCA ATGCTAAGAC CAAGGGTGGC ATGTGCTGGC ACATCACTAA CCACTACTTA 
AACGCTTGTA CTACCGCTGA AACCGCTAAA GCCTGTTTGC AGATTCTGAG ATTCATTCCC 
AACGAAGCAA AGATCTACAT CGATTTCGCA GCCAAATGTA TCGATTGGCA GATCAGAGTC 
TTGCAAGACC CATCGGACAA GTTGATTAAG GATGGTGTCC AGGACACTTC TACAGACTTT 
AACGATACGA AGTGGACATA TAACGTAGGT ACTACGTTAT CTGCTGCCGC TCACTTGTAC 
CATATCACCA AGGATCCTAA GTGGAAGCAG ATAGCTGATG ACTTGGCTGC TGCTGGGATT 
AACAGAGGTG TTTTCTTCTA TGACCGTGAC TACGACGACG CTCACAGATA CTGGAGAGAT 
GCATCCTACT TTGTCCAGTT GCTTATAGAG GGATTGGCAG ACTACTTGTT GTACGTGGGG 
AACGAAGCTC CAGAGGGCTT GCCAGAAAAA ATCCAGGAAG AAGTCAGAAG ACACTTGGTT 
ATGTTCTACG AATACATGAG AGACCCAAGA GACGGCTTAT ATATCCAAAG TTTTGAACCC 
CACAGAACAT ACAAGGAAGT CTACGACTCC AAATACGTCA AGGAGTTTGG TGGCCACAAA 
GGTTGGGGGT TGAAGGACGA AGACAAGTCA GGAGACGAAC CTATGAAGTG TTTGATGGGT 
GGAGGTGCTG CTGCGAGAGT GTTTTTCCAG GGTGCCAGAG TTGTTCCCGA GGTCAAGTAT 
TAG

Protein sequence

MSLSNPNLEG YNVVRNFWLL YYNRNKGTFV APKKCSGCYN EDRFVVWAVA VAVQAVVDGA 
RIYPELRPLI APGIDIFKKY KNPHLRGYSA AENGGNDKDI YYDDDAQVAS AMLTAYEVTG 
EKRYLDLGRE LVRFLMGGWN TNPNAKTKGG MCWHITNHYL NACTTAETAK ACLQILRFIP 
NEAKIYIDFA AKCIDWQIRV LQDPSDKLIK DGVQDTSTDF NDTKWTYNVG TTLSAAAHLY 
HITKDPKWKQ IADDLAAAGI NRGVFFYDRD YDDAHRYWRD ASYFVQLLIE GLADYLLYVG 
NEAPEGLPEK IQEEVRRHLV MFYEYMRDPR DGLYIQSFEP HRTYKEVYDS KYVKEFGGHK 
GWGLKDEDKS GDEPMKCLMG GGAAARVFFQ GARVVPEVKY