Gene PICST_61722 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_61722
Symbol	HYR6.4
ID	4840201
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	+
Start bp	1696495
End bp	1697718
Gene Length	1224 bp
Protein Length	408 aa
Translation table	12
GC content	42%
IMG OID	640391516
Product	hyphally regulated cell wall protein
Protein accession	XP_001385682
Protein GI	150866178
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTATTTT TGAAACTTTT GGTGAGGACA CTTGCTTGTG TGGCAGCTGT TCTTGCTATT 
GATATAACCT CCCCAAGAAT TGATAGAGGT GTTGTCAACC TTTCCATCGG AGACATCACG 
ATTGAATCCG GAGCTTACTG GTCCATCGTA GACAATGCTG TATCTGTACT TGCTGGTGAC 
TTAGATGTCA AGGATGACGC TGGATTCTAC ATTACTTCGA CACAGAGTTT AATTGGCTTA 
TCTGTTACCC TTGCTTCTGG ATTGGGATCG ATCACTAATG ATGGTATAAT TGCATTTAAT 
TCGGTTGTCT CGTTGGTTGC TCCAAATTAC AACTTGATTG GTCTCTCATT CACGAACAAC 
GGAGAAATGT ACTTGGGTAC TAACGGCTCT GTTGTTGGTG CTCCACCAAT TAACCTCGTT 
GCCCCAAGCT GGACTAACAC AGGTTTGTTG GTGATCTACC TGCAAACAAG AAGTGCAGAT 
GGTATTGTCA ATCTCGGAGG AACTGGATTG GTTATTCAAA ACAATGGTCA GATCTGCTTA 
ACGAATGAGC TTTACCAAGC TTCCACTCAA ATTCGTGGTA CTGGTTGTAT AACCGCAAAT 
GTAGACTCTA CTGTTTTCTT GGCTAATGGT TTGTTAGGCG TTGATCAATC ACAAACGTTT 
TACTTAGCTG ACTCCAGATC ATCTATTAGA GCTAATGCTG TTGCTGTTCC TCAAACGTTC 
ACTATTGCTG GTTTTGGTAA TGGTAACATT ATCGGTTTAG ATATTCCACT TGCAACTGTT 
TTTCCGCTAA GCTCGTGGAG TTATACCTCA AGTACTGGTA TCTTGACACT CAGAGGTCTT 
GGTTTATTGT CTCAAAACTT CAACATTGGT CCAGGATATA ATAGCAATTT ATTTTCGATC 
ACAACGGATA GCAGTCTTGG ATTGGCCAGT GTTCCTTTAG GTGGCCTCAC TTACAGTGGT 
CCAGTACCAA ATGCAATTCC TTCGAACTGC CAACCTTGCA AGAATTTGCC TAGTGCACCT 
GGTACATCTG CAAGTGTCAC TTCCACTTCT TTCACTTCTA CCAAGTCTGA TGGATCAATT 
TGTACTGATG TTGATCAAAT CCTCATTTCC ACCGATGCAC AAGGTTCTTG GTTCACATCT 
ACTTCACTTG TATCTGAAGT TTGCAGCACT ATCCCTAACT CTCAGACAAC AGAAACGTCT 
ACTTGGACCG GAACTACTAC TAAG

Protein sequence

MLFLKLLVRT LACVAAVLAI DITSPRIDRG VVNLSIGDIT IESGAYWSIV DNAVSVLAGD 
LDVKDDAGFY ITSTQSLIGL SVTLASGLGS ITNDGIIAFN SVVSLVAPNY NLIGLSFTNN 
GEMYLGTNGS VVGAPPINLV APSWTNTGLL VIYSQTRSAD GIVNLGGTGL VIQNNGQICL 
TNELYQASTQ IRGTGCITAN VDSTVFLANG LLGVDQSQTF YLADSRSSIR ANAVAVPQTF 
TIAGFGNGNI IGLDIPLATV FPLSSWSYTS STGILTLRGL GLLSQNFNIG PGYNSNLFSI 
TTDSSLGLAS VPLGGLTYSG PVPNAIPSNC QPCKNLPSAP GTSASVTSTS FTSTKSDGSI 
CTDVDQILIS TDAQGSWFTS TSLVSEVCST IPNSQTTETS TWTGTTTK