Gene PICST_32802 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_32802
Symbol
ID	4840357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	+
Start bp	666771
End bp	668906
Gene Length	2136 bp
Protein Length	711 aa
Translation table	12
GC content	41%
IMG OID	640391672
Product	predicted protein
Protein accession	XP_001385479
Protein GI	126137912
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.955784
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.581511
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAGA CGAAGTCCAG AGGTAGAAGA GTCGAAAAGA GTGCTGATAA GCTTGAAAAG 
AAGGCTCAGT CTCTTTTCGA AGATACCAAG TCCACTGGCG AAGAAGGCGG AGATGACAGT 
AACGAAATCG ATGCCTCATT GAAAAGTCCA TTTTTCGGTT TAGTAGATTC CAACGAATTG 
GACTACTTCA AACAAGCAGA GTCAACATTG AACGTAAATG CGTTTGATAG TGACGAAGAT 
CGTGAAGGGT TCATTAGATC TGTTTTGGAA GAAGCCAGAG GAAAGGAATT GAAATTGGTC 
ACCAACCAGA TCTGTTCCAA GTTGATGGAA AGATTGATTT TGTTTGCTAG CGATAGACAA 
TTGAAAAACA TATTTGGCCA GTTTTCGGGA CATTTTGTAG CATTGGCCCA TCATAAATAC 
TCTTCCCATG TATTGGAAAC TTTGTTGGTG AGATCTGCTG CCTTGATCGA AAAGGAGTTG 
ATCCATGATG ACAGCAGTCA AAATGAAGAG GAACGGGAAG AACAGGAAGA AGGAGAAGTG 
ACAGATCCTA TGGAAGGTTT GTTCATCAAG ATGGTTGACG AATTCAAGCC TCATTTGCAA 
GGAATGTTGG AACACCAATA CTCATCGCAT GTTCTCCGTT TGCTTATCTT GATTTTGGCA 
GGTAAGGAAT TACCTTCTAC AACTACTTCC AACTCTACCT TGAGATCGAA AAAGTCCAAG 
ATCGCCAGAA AAATGATTGA AATAAAAGAT AACCAAGACT TCAACAAGTC ATTCCAGACA 
CCATCCTCGT TCAAGATTCA ACTAAGAGAA CTCTGTAATT CCGTAAGCAA CAACCAAAAT 
AGCAAACGTA TGAGAGAACT TGCTATACAC AAGATCGCAT CTCCAGTTTT GCAATTACTT 
ATTCAAGTTG AAGGCTTGGT TGATAGAGAT AGAACCTTCT GGCACTTGAT ATTCTTAAAG 
GATTCGGAAG ACAAGAACTC TCAAGAAGAA GCCTTCGTGG AATACTTGTT GTCTGACTCT 
GTTGGTTCTC ATTTCTTGGA AGCAACTATC AAGAATGACG GTGCCAGAAT CAAATACATT 
GAAAGATTAT ACAAGTTATA CATGGAGGAT AGAATCTTAA AGTTAGCAAA GAGATCGACT 
ACCGGTGTTT ATATCATCCA AGCCTTGTTG TTCAAGTTGA AACCAGTGGA CGTTGAACAC 
ATTCTTGATG AAATCATTCC CGAGTTGTCC AATTTGATTT CCATTTCCGA GAACCAAAAC 
TTAGACTTAG GTCAGAGATT AATAGATGCG TCCATCTCCA GAGGTAACTA CAGAAGAGAT 
GAGATCATCG AGCAATTGTT CTTGAAGTTT GCTCCTAACT ACAATGTCCA AGATCCACAA 
CTCAAAACCA CCTCCGAGTT CATCGAAAAC GTCTTGCAAT TGACAGGCTC AACTTTGGGG 
AATACTCGTG ACGACTGGCC AACGGCAGAA GAAAGAAGAA GATCATTTTT CTTGGAAAAG 
TTGATGGAAT ACGACTACAA GTTCGTGATA TGTGTGTGGT ATAACTTCTT GGCTTTGCCA 
GTAGAAAGAT TCATCCAGAT GTGTTTCCAC GGCGTTTTTT CTCATATTGT AGAACGTGCT 
TTAGTGGTTA TACCATCTTC TGAAGGTGAA CCAAAGCCCG TTTTGATTCT CAGAAAGAGG 
GTTTTGAATC TTTTTAAAGA TCAAATTGTC AACATGTCGT GCAACTCTTA CGGATCCCAC 
ATCGTTGATG CATTGTGGAA CTTTTCTGTG TTGTTACCTA TGTATAAGGA TAGAATTGGC 
ACGGAATTGC AGGGAGACTC GCATAAGGTC AAGGAAAGTA CCTACGGTAG ATTGGTGTGG 
AAGAACTGGT CCATGGAATT GTTTGTTAGA AAGAAGTACG ACTGGAAGTC GTTGATCAAG 
CAACAAGAGC AGGCATACTA TGGTGTGAAT GACGAAAATG GAACCACTTC AAGAGTCAAA 
AAACCAATTG AATTGAAGAT GGAAAAATTG GCTGAAGAAA GGAGGTTGCG TGAAGAAGCC 
GCAGCTAAGT CTGAAAGTGG CTACAAGAGA CGACACGAAG ATGATAACGA GGATGACTAC 
GCTAAAAAAC AGAAGCTTAG AGGTCGTAGA AGATAG

Protein sequence

MAKTKSRGRR VEKSADKLEK KAQSLFEDTK STGEEGGDDS NEIDASLKSP FFGLVDSNEL 
DYFKQAESTL NVNAFDSDED REGFIRSVLE EARGKELKLV TNQICSKLME RLILFASDRQ 
LKNIFGQFSG HFVALAHHKY SSHVLETLLV RSAALIEKEL IHDDSSQNEE EREEQEEGEV 
TDPMEGLFIK MVDEFKPHLQ GMLEHQYSSH VLRLLILILA GKELPSTTTS NSTLRSKKSK 
IARKMIEIKD NQDFNKSFQT PSSFKIQLRE LCNSVSNNQN SKRMRELAIH KIASPVLQLL 
IQVEGLVDRD RTFWHLIFLK DSEDKNSQEE AFVEYLLSDS VGSHFLEATI KNDGARIKYI 
ERLYKLYMED RILKLAKRST TGVYIIQALL FKLKPVDVEH ILDEIIPELS NLISISENQN 
LDLGQRLIDA SISRGNYRRD EIIEQLFLKF APNYNVQDPQ LKTTSEFIEN VLQLTGSTLG 
NTRDDWPTAE ERRRSFFLEK LMEYDYKFVI CVWYNFLALP VERFIQMCFH GVFSHIVERA 
LVVIPSSEGE PKPVLILRKR VLNLFKDQIV NMSCNSYGSH IVDALWNFSV LLPMYKDRIG 
TELQGDSHKV KESTYGRLVW KNWSMELFVR KKYDWKSLIK QQEQAYYGVN DENGTTSRVK 
KPIELKMEKL AEERRLREEA AAKSESGYKR RHEDDNEDDY AKKQKLRGRR R