Gene PICST_30906 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_30906
Symbol
ID	4838122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	+
Start bp	1237336
End bp	1238355
Gene Length	1020 bp
Protein Length	339 aa
Translation table	12
GC content	42%
IMG OID	640389437
Product	predicted protein
Protein accession	XP_001383521
Protein GI	126133993
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.407472
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0307188
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTACCG AAAAGATTTC TTTCTTGCTT AATTGGCAGC CAACTCCATA CCATATTCCT 
ATCTATATTG CCCAAACCAA GGGCTACTTC AAGGAACAAG GTATTGATGT TTCAATCTTG 
GAGCCATCCA ACCCTTCTGA TGTTACTGAG CTCATTGGTT CTGGAAAAAT TGACATGGGA 
TTGAAGGCTA TGGTTCACAC TTTGGCTGCA AAAGCCAGAG GTTTCCCTGT CACATCAATT 
GGTTCCTTGT TAGACGAACC ATTCACTGGG GTCTTGTATT TGGAAGGTTC TGGAATCACT 
GCAGACTTCC AATCTTTGAA AGGAAAGAGA ATTGGCTACG TTGGTGAGTT TGGCAAGATC 
CAAATCGACG AATTGACCAA ACACTACGGA ATGACTCCAG AAGACTATAC CGCTGTGAGA 
TGTGGCATGA ATGTAGCTAA GTACATTATC GAAGGTTCCA TCGATGCTGG TATTGGTATT 
GAATGTATTC AGCAAGTCGA ATTGGAAGAC TATCTAAGAA AACAAGGAAG GCCAATTTCT 
GATGCTAAGA TGTTGAGAAT CGACAAGTTG GCTGAACTTG GGTGCTGTTG TTTCTGTACT 
ATCTTGTACA TTGCAAATGA CAACTTCTTA AAAGAGAACC CTGAAAAGAT TAGAAAGTTT 
TTGAAGGCGG TGAAGAATGC TACCGACTTT GTTCTCACTA ACCCCAAGCA GGCTTGGGAG 
GAGTACAGCG ACTTCAAGCC GCAGATGACT TCGGAATTGA ACAACAAAAT GTTCGAAAGA 
TGTTTCGCCT ACTTCTCAGA CTCATTGTAC AATGTACATC GTGACTGGAA GAAGGTAACT 
GCCTATGGTA AGAGATTGGA TATCATTCCT CAGGATTTCC AGTCCAACTA TTCGAACGAG 
TACTTGTCTT GGCCAGAACC AAAGGAAGCT GAGGACCCAT TGGAAGTTCA AAGGAAGATG 
GCTGTTCACC AGGATGAATG TAAAGCTTGT GGAGGTTACA GAAGATTGGT TCTTTCGTAG

Protein sequence

MSTEKISFLL NWQPTPYHIP IYIAQTKGYF KEQGIDVSIL EPSNPSDVTE LIGSGKIDMG 
LKAMVHTLAA KARGFPVTSI GSLLDEPFTG VLYLEGSGIT ADFQSLKGKR IGYVGEFGKI 
QIDELTKHYG MTPEDYTAVR CGMNVAKYII EGSIDAGIGI ECIQQVELED YLRKQGRPIS 
DAKMLRIDKL AELGCCCFCT ILYIANDNFL KENPEKIRKF LKAVKNATDF VLTNPKQAWE 
EYSDFKPQMT SELNNKMFER CFAYFSDSLY NVHRDWKKVT AYGKRLDIIP QDFQSNYSNE 
YLSWPEPKEA EDPLEVQRKM AVHQDECKAC GGYRRLVLS