Gene PICST_80841 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_80841
Symbol
ID	4851077
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	881296
End bp	882792
Gene Length	1497 bp
Protein Length	488 aa
Translation table
GC content	42%
IMG OID	640392785
Product	conserved hypothetical protein
Protein accession	XP_001387805
Protein GI	126274063
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.801804
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCATCA CAAATCTATC TGTAGATCAT TCTCTGACTG ACAGCGATAA GCATGCTTCC 
AAGTCCAAGA TCATATTTGT CACCTTCGTG TTTATCCTAT CGCTTGTTTC GTTTGTAACA 
CAGACAGAGT TCACTTCCCA AGCTTATCAA TTAGGATTCA GCGAACCGGT AGTATTGCTT 
TTGGTTACCC ATGGCTCCTG GTGGATTCTC TGGCCATTAC AGGCAATAGG CGTATCTTTG 
TATAGAACCG TAAACAAATA CAGACAAAAC CAGAGCCAGA GTCAAATCTT GCAAGACCAG 
AACCAGACCC AGAGACAGCA TCGATACAGT GCTAGTTCTG ACAGACAATA CCATCGTTTA 
GCCTCCACTT CAGAATTGCT CGAATCTCAC ATCGATTCTG AACATCCTTC TGACGCTATA 
CCAGGACTAA CTAGACCCGT GAACTATGTC TCATACTTCA AGAAATGTTT GGTAAAACAA 
TTTCACAATG TGTACCACAC CTCTATCTTG ATCTTTGAAA GTAATGTCAA CGACGACAGA 
ACCACCGAAA ACTTGAATTC ACTTATAGAG AAGAATCCTC ACGTTTCGTA CTCAAATTCC 
ATCACTGAAT GTGTCAAAAC ATTCTTTGCT ACTCCTTCTA TTCAATACGT AGTTAAAAAG 
GCTCTCCTTA TCACATGTTT ACTTACCGTC GCTGGCTCGA CTTGGTACGG TGCCATGGCA 
ATGACATATG CTTCAGATGT TACAGCTATC TATAACTGTT CTGCATTCAC TGCTTATGCA 
TTTGCCATTC CCATCTTGAA AGAGAAGTTT TCTTGGCTCA AGGCCAGCTC TGTAGTCATT 
GCAGTACTGG GAGTCTTCAT TGTTGCCTAC TCTGGAAGCG ATGCAGACTC GCTGTCCAGC 
GAAGATTACC CCTACAGATT CTGGGGAAAC TTGATCATCT TGATTGGAGC CATCTTGTAT 
GGTTACTATG AAGTTCTTTA CAAGAGATAC TTGTGTATTC CTCCTCACTT AACTGCCATC 
ATAACTCCAC GTCGTCAGCT GACATTCGCC AACTTCGTCA TGGGATTCTT TGGTTTTTTC 
ACCTGCTTGA TTGTTCTCAC AATAATCTTG ATCGCTGAAG TTTTCCGCAT TCATAGCTTC 
AATTTCTTCA ACTATGGCGA AGACACTACA CTCATCTGGA AGTATATAGT AGGCTCTATC 
TTCCTGAACT TGATCTTCAG TGCCTCTTTC TTGACATTGA TGGCACTTAC CAGTCCTGTT 
CTTTCATCTG TCAGTTCGCT CCTCACAATC TTCTTGATTG GTTTGGTTGA ATGGGTCATG 
TTTGGCAATG TTTTGGATTT CCAGCAATTG TTGGGAGACT TCTTGGTTAT TGTAGGGTTT 
GTTCTCTTAA CAATTGCATC CTGGAAGGAA ATCAGTGAAG GACAAGACGA TGACGATGAT 
ATGGACGTCG TCAGTACATA TTCATTTGCT GTCAGTACTG AAAGCAGCGG CAACTAG

Protein sequence

MAITNLSVDH SLTDSDKHAS KSKIIFVTFV FILSLVSFVT QTEFTSQAYQ LGFSEPVVLL 
LVTHGSWWIL WPLQAIGVSL YRTSQILQDQ NQTQRQHRYS ASSDRQYHRL ASTSELLESH 
IDSEHPSDAI PGLTRPVNYV SYFKKCLVKQ FHNVYHTSIL IFESNVNDDR TTENLNSLIE 
KNPHVSYSNS ITECVKTFFA TPSIQYVVKK ALLITCLLTV AGSTWYGAMA MTYASDVTAI 
YNCSAFTAYA FAIPILKEKF SWLKASSVVI AVLGVFIVAY SGSDADSLSS EDYPYRFWGN 
LIILIGAILY GYYEVLYKRY LCIPPHLTAI ITPRRQLTFA NFVMGFFGFF TCLIVLTIIL 
IAEVFRIHSF NFFNYGEDTT LIWKYIVGSI FLNLIFSASF LTLMALTSPV LSSVSSLLTI 
FLIGLVEWVM FGNVLDFQQL LGDFLVIVGF VLLTIASWKE ISEGQDDDDD MDVVSTYSFA 
VSTESSGN