Gene PICST_50942 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_50942
Symbol
ID	4840840
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	+
Start bp	151770
End bp	152825
Gene Length	1056 bp
Protein Length	351 aa
Translation table	12
GC content	45%
IMG OID	640392155
Product	predicted protein
Protein accession	XP_001386426
Protein GI	126139808
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1635] Flavoprotein involved in thiazole biosynthesis
TIGRFAM ID	[TIGR00292] thiazole biosynthesis enzyme

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.920544
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCCTC CAACTAGAAT CGAAACTACC ACTTCAGTTG TAGAAGTGAA CCTTGCTAAA 
GTCAGCAAGA AATCTATCAA ACTTGAGTCT CAAGCTGACA ATGCCGAAGT CACATTCGCA 
GACTGGGAAA ATTTCAAATT TGCACCCATC CGTGAGTCTA CAGTTTCCCG TGCTATGACC 
AAACGTTACT TTGCTGACTT GGACAAATAC ACTGAATCTG ATGTTGTTAT CGTTGGTGCC 
GGTTCTGCTG GTTTATCTGC TGCTTACGTT TTGGCCAAGA ACAGACCAAA CTTGAAAATT 
GCTATCATTG AAGCTTCTGT ATCTCCTGGT GGAGGGTGTT GGCTCGGTGG ACAGCTTTTC 
TCGGCCATGG TGTTGAGAAA GCCTGCCCAT CTCTTCTTGG ATGAATTAGA AATTCAATAC 
GATGACGAAG GAGACTATGT TGTTGTCAAA CACGCTGCTT TGTTCATGTC CACTTTGTTG 
TCTAAAGTTT TGCAATTTCC TAATGTCAAG TTGTTCAACG CTACTGCAGT TGAAGACTTG 
ATCACCAGAA GAGATGAGAA CACTGGTGAA TTGAGAATCG CAGGTGTGGT GACCAACTGG 
ACTTTGGTTG CATTGAACCA CGACACTCAA TCTTGTATGG ATCCTAATAC CATCAACTGT 
AACATTGTAT TGTCTACTAC TGGCCACGAT GGTCCATTTG GTGCTTTCTC AGCCAAGAGA 
TTGGAAGAAC TCGGTAAGGC TCCTAAGGAC ATCACCCAAG GCTTCAGACC TCAAGAACGT 
GCACAACCTG TTGCAGCATC TGCTGATGGT TTCCAATTGG GAGGCATGAG GGGCCTTGAC 
ATGAACAAGG CTGAAGATGC CATTGTCAAG GGTACCAGAG AAGTTGTTCC AGGATTGGTC 
ATTGCTGGTA TGGAATTGGC TGAAGTTGAC GGTTCTAACA GAATGGGTCC TACTTTTGGA 
GCCATGGCTC TTTCTGGTGT CAAGGCTGCT GAGTCTGTGT TAAACGCTTT TGACTTGAGA 
AAGAAGCAAA ACGAAACTTG CTATGGTGCC CAGTAA

Protein sequence

MAPPTRIETT TSVVEVNLAK VSKKSIKLES QADNAEVTFA DWENFKFAPI RESTVSRAMT 
KRYFADLDKY TESDVVIVGA GSAGLSAAYV LAKNRPNLKI AIIEASVSPG GGCWLGGQLF 
SAMVLRKPAH LFLDELEIQY DDEGDYVVVK HAALFMSTLL SKVLQFPNVK LFNATAVEDL 
ITRRDENTGE LRIAGVVTNW TLVALNHDTQ SCMDPNTINC NIVLSTTGHD GPFGAFSAKR 
LEELGKAPKD ITQGFRPQER AQPVAASADG FQLGGMRGLD MNKAEDAIVK GTREVVPGLV 
IAGMELAEVD GSNRMGPTFG AMALSGVKAA ESVLNAFDLR KKQNETCYGA Q