Gene PICST_55876 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_55876
Symbol
ID	4837555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	738695
End bp	739885
Gene Length	1191 bp
Protein Length	396 aa
Translation table	12
GC content	44%
IMG OID	640388870
Product	predicted protein
Protein accession	XP_001382908
Protein GI	150864184
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0416989
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.862936
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAAAA CCTTATCGCT CCAGAGTAGG GCAAAAACGA CTGCTCTCAA GCAGCCTAAA 
GAGATTTTTG CTTTTGCTCG AGACATAGAC GGCGAATTCG TGTACGACCA GAAAATAGTC 
AAAGACGAAA ACGTATCGTA CTACTACTTG CCAGACTCCA AGATTGATGG AAGCATCGAC 
TTGCAAGCTG GGTACGCCAA ATTCAAAAAA ATCCCAGAAG AGAAGAACAT GCTGGATATG 
AAGTGTTTGC TTACGGCACT CACGAAGTAT GAGCAAGAAC ACAACAACGG CGAAAAAGTA 
AATGTAGATA TCATCACATA CCGAGGGTTA ATGACTAAAT TGCTTGCTTT ACCATACAAC 
TTGAACGACC CTGTAGATCT CAATGTACTA GCCTATGATG GACAATTGTT TATCAACAGC 
GACGAGGAGA TCGAATTGGC AAGAAGAAAA GAAGAAGACG AGCACAAACA ACAGAGTATG 
ACTCCAGAAA AGTATGATCA CATGAAGCGG TGTGAATTTA GCGGATACAA GTTTGAAGCC 
ATAGCCACAT TGCCCAAGCC CTGGGCCGAC TGTAGTCGTC AACAAATCGA TAAAAGAGGC 
AAGAAAATGG TGAACAACTA CGAACAGTAT ATTTCAGTAA TAAAGACTGG CATTGGTGAG 
GCCAAGATGC TTTTGGCAGG AGAAGTGGAC TGTGTGTGGG ACTATATTCC AGAAGACGGA 
AAAGATGTTC TTTCACATTA TATGGAGTTG AAGACAACTA GAATATTGGA GTCGAACGGC 
CAGGTGGTCA ACTTTGAAAA GAAGTTGTTC AAGACGTGGG CCCAGTGTTT CTTGATGGGT 
ATCCGTAAAG TGGTGTACGG ATTCCGTGAC GATTCGTTCT TCTTGCGCGA CGTCGAGTTG 
TACAAGACGG AGGAGATCCC GTTGCTAATC AAGAACAATG CGCTTACTGA GAACAAATCC 
GGGGGAAAGA TCAACTGTAC CACTGCCTTG AAATGGTATG GAGCAGTCAT TGAATGGCTC 
TTGCAGGAGA TTCCAAGAGA CGATACTTCC AAGGCCTATC GAGTGAGTTT TGATCCAAGC 
ACAAGAACTT TCACGTTAAG AGAGTTGATG GGTAATGAGA ATAGTAGGTT GAGAAACGGC 
GAGATGTTGA CCTCGGAATT CAAGCAATGG AGAGAAAGCA TCCAAAAGTG A

Protein sequence

MMKTLSLQSR AKTTALKQPK EIFAFARDID GEFVYDQKIV KDENVSYYYL PDSKIDGSID 
LQAGYAKFKK IPEEKNMSDM KCLLTALTKY EQEHNNGEKV NVDIITYRGL MTKLLALPYN 
LNDPVDLNVL AYDGQLFINS DEEIELARRK EEDEHKQQSM TPEKYDHMKR CEFSGYKFEA 
IATLPKPWAD CSRQQIDKRG KKMVNNYEQY ISVIKTGIGE AKMLLAGEVD CVWDYIPEDG 
KDVLSHYMEL KTTRILESNG QVVNFEKKLF KTWAQCFLMG IRKVVYGFRD DSFFLRDVEL 
YKTEEIPLLI KNNALTENKS GGKINCTTAL KWYGAVIEWL LQEIPRDDTS KAYRVSFDPS 
TRTFTLRELM GNENSRLRNG EMLTSEFKQW RESIQK