Gene PICST_50114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_50114
Symbol
ID	4840560
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	+
Start bp	1027420
End bp	1028436
Gene Length	1017 bp
Protein Length	338 aa
Translation table	12
GC content	39%
IMG OID	640391875
Product	predicted protein
Protein accession	XP_001386205
Protein GI	150866562
COG category	[L] Replication, recombination and repair
COG ID	[COG0084] Mg-dependent DNase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.975027
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAACA TTTCCATAGC TTTGTCTCTA GCAGACAGCC ATTGCCATAT TGGAATAGAT 
TGCACTGATT CCGATATCGA TGCTTTGGCA GACCAATTCA ATAATGGACT TGTAGACAAA 
GACGATTTCT TCCATATCAT GACAACCTAC CATCTTGATG TAGGTTTTGT TGATCGACTT 
CTTTCACAAC TAAAAAGTTC AGTAGTGGTT GCCTACTTTG GAGTCCATCC TTGGTACAGT 
CACTTGTTTT CCACAGAAGA TCATGGAGAT GTTGACTTGT TACAATTGAA AAAATTACAT 
TACAATAAAG TCCTTGTACC AGCACCTAGC GAAGACTTGT TGCTGGTATT ACCAGTGCCG 
ATACTGCTAG AAGAACATAT GACTAAGCTA GAGAGATTGA TAGAGATACA CGGCCATAAG 
TTCAAATGTG GAATTGGGGA GATTGGCTTA GATAAGCTAT TCAGAGTGCC GTCTAACGGC 
TACTTTGGCA GCCAGTTGGC ACAAAACAAC GGAGCTACCA AATTGTCATC TTGTAAGGTA 
TCTATGGAAC ACCAGACAGC AGTTTTTGAC AGACAATTGC AATTGGCAAA CAAGTTAAAA 
AAACATATCT CAGTACATTG CGTAAAAGCT CACGGACTAT TGTATGATAT TATACCAAGA 
TATACAAGCA TCTCATCTGT AATTCTTCAC TCATACAGTG GGTCTTCTGA TCAGGCCAAG 
AGGTGGATAA CTACTTATAA GGGTAAGAAA TCAAAGTTAT TCTTTTCATT CTCTAATTGG 
ATCAATGGAA CAGACAATAA AAGATGCCTA TTAGAAGACA TAATTGGTTA TGCGGAAGAC 
AACCAGATTC TCGTTGAGAC AGATGTTTCT GTAGATGATT ATCTTGTGAG AGGAAAGCAT 
GAAGATTACT TTCTCCATTT AGAAGGAATA TTTGAAAAGG TTGGAACCAT TTTGGGCCGA 
GACCAAGATG AGATGGTGGA GTTGTTGAGA AGAAATATGT GCCGATCTAT AGAGTAG

Protein sequence

MSNISIALSL ADSHCHIGID CTDSDIDALA DQFNNGLVDK DDFFHIMTTY HLDVGFVDRL 
LSQLKSSVVV AYFGVHPWYS HLFSTEDHGD VDLLQLKKLH YNKVLVPAPS EDLLSVLPVP 
ISLEEHMTKL ERLIEIHGHK FKCGIGEIGL DKLFRVPSNG YFGSQLAQNN GATKLSSCKV 
SMEHQTAVFD RQLQLANKLK KHISVHCVKA HGLLYDIIPR YTSISSVILH SYSGSSDQAK 
RWITTYKGKK SKLFFSFSNW INGTDNKRCL LEDIIGYAED NQILVETDVS VDDYLVRGKH 
EDYFLHLEGI FEKVGTILGR DQDEMVELLR RNMCRSIE