Gene PICST_33737 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33737
Symbol
ID	4841062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	-
Start bp	364115
End bp	365281
Gene Length	1167 bp
Protein Length	388 aa
Translation table	12
GC content	45%
IMG OID	640392377
Product	predicted protein
Protein accession	XP_001386657
Protein GI	150866906
COG category	[I] Lipid transport and metabolism
COG ID	[COG1562] Phytoene/squalene synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.605326
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTAAGGT GTAACCGTCT AGTTGTGCGA TCGGGTTTGC GAAGATCTTA CTCTTCAATT 
TCTTCTTCCA AGTACGAAGT GCAGTTGTTT AATGCTACTG AGAATATCAA TAAGCTCTTG 
GAGACCCATG ATCGTTCTTC ATATATATTA GCACAGTACG TTCCCGAGCC AGCCCGAAAC 
GCCTTCTTGG CTATACGGGC TTTCAACTTG GAGATCAATA AGATCAGCGA TGGTGGCAGC 
AATACAGGCT CCGTCGCTTC CAAGGCATCT TCACAACTTT CCAAGTCAAT GGGAATCTCC 
ACAGCAGACA TGAAGTTCAA GTTCTGGAGT GATTTAGTCG CCAGGGTGTT CACGGAAGAC 
CCATATCTGG AAAAAGACAT CGGTGAACCC ATAGCCATAT TGTTGAGAGA TGCATTACGG 
AACGACTTGA ACTTAGACGT TACTTATTTC CATCAATTCC TACAGACTAG AAGGCAATTC 
TTGAAGTCCC CGACGTTCCA GACTGTAGAC GACATTTGTT CCTACGGTGA AGGAACCTAC 
TCCCAATTGA ACTACCAGAC TCAAGCTCTA TTACTATCTC CGTCCATATC GCCTTCTGTG 
ATTAGTCTTT TGGAACAATC AACATCGTTG CAGTCTAAGG TAAGTGATAT CGCTGCACAT 
ATCGGGCAAG CCACAGCTGT CGGTGCCATG ATCTTGGGAA TGAACTACTA TGCTACGTCC 
AGAAACCAGG TCACGTTGCC TGTGAATTTG ATGTCCAAGT ACGACTTGTC CCAGGAGTCA 
GTGTTGAAAT TGGCCCAAGG ACACGTGAAA GAGAAGACAG AGGTAGATGC TATCAGAGAC 
AAGTTGAAAA ATATCGTTTA CGAAACAGCC ACAACATCCA ATGATCATAT CCTTACAGCC 
AGGGCCAAGT TATCACAATG CAAACAAGAG ATCAACGAGA TAGTCAGGGC CAACATGCAT 
GACCAATTAC TTCAGAAGAA CTCCAAGCGT TGGCGGAAGT TCATGCCAGA TGTAATTTTC 
ACTCCTTTCA TGGTAGCCAT TCCTACGACG TTGTACTTGA ACAAGTTAGA GAAACACGAC 
TTTGATATTT ACCACCACAA GATGCAGCAG AAGGAATGGC GGTTGGCGTG GACTTCGTTC 
AAGGACTACT ACCAGAGAAC GATATAG

Protein sequence

MLRCNRLVVR SGLRRSYSSI SSSKYEVQLF NATENINKLL ETHDRSSYIL AQYVPEPARN 
AFLAIRAFNL EINKISDGGS NTGSVASKAS SQLSKSMGIS TADMKFKFWS DLVARVFTED 
PYSEKDIGEP IAILLRDALR NDLNLDVTYF HQFLQTRRQF LKSPTFQTVD DICSYGEGTY 
SQLNYQTQAL LLSPSISPSV ISLLEQSTSL QSKVSDIAAH IGQATAVGAM ILGMNYYATS 
RNQVTLPVNL MSKYDLSQES VLKLAQGHVK EKTEVDAIRD KLKNIVYETA TTSNDHILTA 
RAKLSQCKQE INEIVRANMH DQLLQKNSKR WRKFMPDVIF TPFMVAIPTT LYLNKLEKHD 
FDIYHHKMQQ KEWRLAWTSF KDYYQRTI