Gene PICST_3402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_3402
Symbol	HYR6.2
ID	4840202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	+
Start bp	1703837
End bp	1705063
Gene Length	1227 bp
Protein Length	409 aa
Translation table	12
GC content	41%
IMG OID	640391517
Product	hyphally regulated cell wall protein
Protein accession	XP_001385683
Protein GI	150866179
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.25351
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCTTT TCAGAAGCTT AGTCAGAGTT TTTCTCTTTG CAACTGTTGC TTTGGCTTTT 
ACGGTCCAAA AACCTAAGGT TGACAGAGGT TCTATCAACC TCTCTATTGG TGATATTACA 
ATTCAGTCTG GCTCTTTCTG GTCCATTTTT GACAATACTG TTTCCATATT TAAAGGTGAT 
CTTTGGGTGC AAAAAAATGC TGGTTTTTTT ATCACATCCA CCAACAAGTT GATCGGTTTG 
AAAGTTGAAC TTGCATCAGG ATTTGGATCT ATTAGAAACG ATGGCTTGAT CGTCTTCAAC 
TCCCTTGTCT CTATAACTCC ATCATTTTAC AAACTTATTG GCAAGAGTTT TCTTAATTCT 
GGAGAAATAT TTTTGGTGTC TAGTGGTTAT GGAGTACCAA CAGCTGCACT TTTGGCTCCA 
ATTTGGAAAA ATACTGGTTC CTTGACTTTC TTTCAGAACA AAAGAAACAA CGGGGTCGTC 
AGTCTTGGTG CACCAGGATT AAAAATTGAA AATTGGGGTC AGATTTGTTT GTTCAATGAA 
CTTTATAAAC AAACGACCCA TATCTTTGGT GATGGTTGTA TTACCGCAGA TCAAGACTCT 
AGTATTTTCT TTTCAAACTG TTTATTGGAT ATTGATAGTA GACAAACCGT CTACTTAGCA 
GACTCGAGGT CCTCGGTAAG GGCTGTGGCT CTCGCTAAGC CAAAGACTTT CAAAGTGGCT 
GGTTTTGGAA ATGGAAACAA AATTGGATTG GATTTACCAC TTATCAGCCC ATTCCTGAAA 
TCAGTAATCT ACAATGCTAA AACGGGAATC TTATCGCTTA GAGTTAAGGG CTTTTGGGGG 
CAAGACTTCA ATATTGGTTT AGGTTACAAC TCGAACAAAT TTAAGATTAC AACTGACAAT 
AGTCTCGGGT TGTTGAGTGT TCCATGGGGA GCTGTCTATT ATGACGGTCC AGTACCTAAT 
AAGCAGATTC CAAGCAACTG TCAACCATGC AAGCCCTATC CATCACCTCC TACAACTACT 
ACAACGAAGA CAAACGCTCA AACTACCAAA ACATCTACTT GGACTGGTAC TTTCACCACC 
ACCGTCACCG AAACTGATAC CCCAGGTGGT ACCGACACTG TCATCGTTGA AGTTCCTTCT 
ACTCCAAACT CTCAGACTAC TCTTACCTCA ACTTGGACCG GTACTTTCAC CACCACCGTC 
ACCGAAACTG ATACCCCAGG TGGTACC

Protein sequence

MLLFRSLVRV FLFATVALAF TVQKPKVDRG SINLSIGDIT IQSGSFWSIF DNTVSIFKGD 
LWVQKNAGFF ITSTNKLIGL KVELASGFGS IRNDGLIVFN SLVSITPSFY KLIGKSFLNS 
GEIFLVSSGY GVPTAALLAP IWKNTGSLTF FQNKRNNGVV SLGAPGLKIE NWGQICLFNE 
LYKQTTHIFG DGCITADQDS SIFFSNCLLD IDSRQTVYLA DSRSSVRAVA LAKPKTFKVA 
GFGNGNKIGL DLPLISPFSK SVIYNAKTGI LSLRVKGFWG QDFNIGLGYN SNKFKITTDN 
SLGLLSVPWG AVYYDGPVPN KQIPSNCQPC KPYPSPPTTT TTKTNAQTTK TSTWTGTFTT 
TVTETDTPGG TDTVIVEVPS TPNSQTTLTS TWTGTFTTTV TETDTPGGT