Gene PICST_31980 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31980
Symbol
ID	4839142
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	+
Start bp	388400
End bp	390511
Gene Length	2112 bp
Protein Length	690 aa
Translation table	12
GC content	36%
IMG OID	640390457
Product	predicted protein
Protein accession	XP_001384732
Protein GI	150865493
COG category	[S] Function unknown
COG ID	[COG4886] Leucine-rich repeat (LRR) protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.25184
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTCCG TTGTTCATTT TGATTTGTAT CCAGAGCATT TCTATCAAAA AATAATAGAT 
GAGTTACCAT TTCTTATTGT TCTAGTACTT GCCTGCAACT CCAGTTCACC CTACCAGAGG 
TACCTTCTCA ATTCCATCTA CAAAGAAATC GAAATTCAAT ATATTTCTCC TCTGCCAGGA 
CTAAGACTCG AATTTTTAAA GCAATTTTAT CTTCTAAGAT ATAATGTTAT AAATCCTAGT 
GATGAGAAAG ATTATGTTCC CTGTAAGGTA GTTGGAAAAA ATGTAGATCT GTTGGTAACT 
TTTCTTAACG AGAATCCCCT GGTTGCTGTT CGTCATCTAC GATTGGTTGC GATACCAAGT 
GAAGAAGTAA TTGCAAAAGT TAGAAGTCTT TCTGACAGAA TTGGTAAGAT TACTTTTATT 
TCTGCTCGTG TAATTGATGA ACAACAAGAT GCCAGCATGA ATTGGCCAAC AGAAAGAGAC 
GCAGCATACT TGTGTGGACT TCGCAGTAAG TTTGTTGAAT CAATGTATTA TCCGGAATCC 
TTAGTGCATC TAGATTTAAA CTTTTCAGAT CCAACAAATT ACAGTGATAC CCTTCTGGAA 
CTTCTTTTCA AGCTTCGGTA TCCACCCAGA CTTGAATTTC TAAGTTTGTC CGGTGGCAAG 
GAAGCGATTG ACTCTAAAGT ATTTTCTCGC TTTCCACGAA CTATTAAATC CCTCATCTTG 
GACCTCTATG ATATTCAATG TGATGGATTT TTGAAATTGA ACTTGCCTCC TTTCTTGAAA 
TTTTTCTCGT GTACAGTAAT TGTTGATAAG AATAACAGAT GTTTTGATAT TTCCCATCTT 
TCCCATCTTA CAGAGGTGAA ATTGTTTTTC TACTATCATC TAATTCCATT GTCTATCTTC 
AGATTTCCTC GTCTGTTGCA GACATTAAGT GTGGATAGTG GCCTTTCATC TTCGGGTATG 
GAACAACTTG CAGAATTAGA CCAATTAAAA CAAGTAACCA TACGTGTTTA TCGTAGTCCG 
AACAATCCGG TACCAATCTT AAGGGAAGCA GTCCATTTAC CAAATTCTAT TGAAGATCTC 
CTGATACAAG ATTACACTAT TGACGGCGAT GTTGATGGTG CATATTTTAT TCCAAAAAGC 
ACAAAGAAGC TCCAACTTCA AAATAGCTAC GGACTTTACT TTATTCTGGA ATTGAGCGTC 
TTAGAATCAC TACACATTAG CTATACTTCG TGTAGGATTC CTCATCTACA AAATTTGAAT 
ACTTTGGTAA TAAAGAGTGT GGAAATTGAT TCTGTATCCA TGTGGAAAGA TGTACATCGC 
CTTACAAACT TGAAACATAT GAGCATAAAT GATTGCGAAC TTGATTGCTT GAATTGCACT 
CTTCCTAGTT TCCTTGAAAC TCTCGATGTT TCACGAAACA ATATCGAAGA AGCTGATATC 
ATACTTCCTG CAAATTTCAA GAGTTTGGAT ATCTCTCATA ATGAAATATG CAAATTCAGT 
GCTAAAGGCA GATTGTTGAC ATTGAATCTT GATACTAATC GCATGTCCGA ATTATCGAAT 
TCAACTCTCT GTATCCCCTG TACCGTTTGT GAATTGAACA TGAGTAATAA CGATACGATA 
TCAATTTCAA GTGACTTTTC TTTTCCAGAA TCTGTGAAGG TGTTACGCTT AGATTACAAC 
TTCTTTTCTG ATTATACGGT ATTATTCAAG ATGCCTTCCC AGATCTTGTT GCTACTGTTG 
GACAGTTCTT TTTTTTTATA TCCAGAAACT AAAGAACCAA CTCCAGTAAT AATGAATTAT 
CCGAAGCTCT GGCATTTCAG TATGACATCC TCCATAGGTA CTGAGTATCT TGACTTCAAT 
TGGAATGGTT GTCCGAATCT AGAAAGTATC TTGATGAATG GCTGCAAGTT TGAAATAATT 
AAACTTGAAA ATCTTCCGCC TTCAGTCAAG ATTGTTGATT TCAGTGATTG TAAAGTTCGA 
AAAGTTGAAG GAAGATTTGA GAGATTACCT CATTTGATCG AGTTCAATCT CGAAGACAAC 
CGATTGGCTC CAGGAGTAGA AACTTTCGGA AAAATGGGAA TGGGTTACGT CTCCCAAGCA 
TTGCGTTGGT GA

Protein sequence

MDSVVHFDLY PEHFYQKIID ELPFLIVLVL ACNSSSPYQR YLLNSIYKEI EIQYISPSPG 
LRLEFLKQFY LLRYNVINPS DEKDYVPCKV VGKNVDSLVT FLNENPSVAV RHLRLVAIPS 
EEVIAKVRSL SDRIGKITFI SARVIDEQQD ASMNWPTERD AAYLCGLRMH LDLNFSDPTN 
YSDTLSELLF KLRYPPRLEF LSLSGGKEAI DSKVFSRFPR TIKSLILDLY DIQCDGFLKL 
NLPPFLKFFS CTVIVDKNNR CFDISHLSHL TEVKLFFYYH LIPLSIFRFP RSLQTLSVDS 
GLSSSGMEQL AELDQLKQVT IRVYRSPNNP VPILREAVHL PNSIEDLSIQ DYTIDGDVDG 
AYFIPKSTKK LQLQNSYGLY FISELSVLES LHISYTSCRI PHLQNLNTLV IKSVEIDSVS 
MWKDVHRLTN LKHMSINDCE LDCLNCTLPS FLETLDVSRN NIEEADIILP ANFKSLDISH 
NEICKFSAKG RLLTLNLDTN RMSELSNSTL CIPCTVCELN MSNNDTISIS SDFSFPESVK 
VLRLDYNFFS DYTVLFKMPS QILLLSLDSS FFLYPETKEP TPVIMNYPKL WHFSMTSSIG 
TEYLDFNWNG CPNLESILMN GCKFEIIKLE NLPPSVKIVD FSDCKVRKVE GRFERLPHLI 
EFNLEDNRLA PGVETFGKMG MGYVSQALRW