Gene PICST_57505 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_57505
Symbol	DUR5.3
ID	4837703
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	889075
End bp	891081
Gene Length	2007 bp
Protein Length	668 aa
Translation table	12
GC content	41%
IMG OID	640389018
Product	urea transport protein
Protein accession	XP_001383804
Protein GI	150864823
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.20443
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.667471
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGACA CTGATACTGT ATTTTTGCTT CCAAAAGGTG CCGGTTATGG GGTGTTGCTC 
GGTGTTGGTG CCGTTTTTGC AATCGGTATG ATCTTAACTA CCAAATTCTT GCAGAAGTAT 
CTCAACGAAA ATGCAACTTC TACGGAAACT TTCTCTGTTG CTGATAGAAG TGTGAAGCGT 
TTCTTGGCGT GTTCTTCTGT TTACGCTTCT TGGTCTTGGG CCGATGAAAT TTTGCAGACA 
GTGTCTATGA TCTACAACTA TGGTGTTCAA GCCTCGTTTT ACTATGGGGC CGGTTTATCG 
GTGCAGATGT GCGTTATGGC TCTTATTGGT ATCAGTGCTA AAAAGAGAGC TCCTCAAGCT 
CACACTTCGC TTGAAATTGT CGGTTTGAGA TATGGAAAGG CTACTCATAT ACTTTTCTTG 
TTCCTCTGTT TGGTTACCAA CTTGATTTCA TGTTCCTCTA TGCTTTTATC TGCTAGTGGT 
GCCATTTCGA TCATTTCTGG AAACCTTTCA ATTGTTGCAA GTACATTACT TATTCCATTC 
GGAGTTTTAT TGTATACTAC CTTTGGTGGG TTGAAAGCAA CATTCTTGAC TGATTACGTT 
CACTCTTTCG TCTTGTTGTT GATTTTGATT GTCATCAACA CTAAGGTTCT TGCTTCCAAG 
GAAATCGGTG GTTTGAACGG CCTTTATTCT CAATTGTTAG AACACTCTCA AGATAGATAT 
ATCGAAGGCA ATTATCAAGG TTCTATTCTT ACTGGTAAGT CTCAAGGTTC TATCATCTTC 
GGTTTGGTTT TGACTTGTGG TAACTTTGGT TTGACTGTCA TGGACTCTTC TTTCTGGCAA 
AAGTCGTTCT CTGCTGAAGT AAAGGCTACT GTTCCTAGTT ACTTGGGTTC AGCCGTCTTG 
ATTTTTGCAA ACACTTGGCC AATTGGTGCT ATTATCGGAG GTGCCAGTAT CATCTTGCAA 
GGCCATCCTA GCTTTCCAAC CTTCCCAAGA AAGATGACTC AGTTCGAAAT CGACTCTGGC 
TTTGTTCTTC CTTATACTGT CAAAGCTGTT TTGGGTAATA GTGGTGTTGG TGCTGTCTTG 
TTGACTGTCT ACCTTGCTGT AACATCTACC TCGAGTGCTC AAATGATTTC TGTTTCGTCG 
ATCTTATCCT TCGATATCTA CAAGAAGTAC ATTAACCCTC AAGCTAACAA CAAGCAGATG 
ATCCGAGTTG CTCATTTCGG TGTTGTCTTT TTCGGCTTGT TTGCTGCTGG TTTCACACTT 
ATGCTTCACT ACGTTAATGT TAACATGACA TGGATGGGCT ACTTCATGTC CATCGTCATC 
TGTCCAGGTG TGTTCCCACT TATTTTCACT GTTACTTGGG ATAGACAAAC CACAATCGCT 
GCCTTTGTCG CTCCTATTAC CGGATTGGTC TTCGGTTTCG CCGTATGGAT CACTACCACC 
AATAAACTCT ATGGAGAAAT TACTATCGAC ACTCTTGGTA TGCAAATCCC TTGTCTCTAC 
GCTTCCTTGA CTGCCTTGTT CCTTCCTGCC GTTGTAAGTA TTATTCTCAG TTTGACTGTT 
TTCCCAAAGA AATTTGACTG GAAAGAATTG CTGGAAGCTA AGCTTTTGAT CAAGGCTACG 
GGATCTGAAT CTGAATCTGA ATCTGAAAGT GAAGGTGAAA AGTCTGCCAT CAAAGAAAAG 
TCCACCATCG AAAATGTTCA GGTTTTCACA GTGGAAGAAG ACTTAGGAGT TCGTGCAGCT 
GATCCAGCCG AGTTGAATTT CTATTCCAAA GTTGCCAAAA TTGGTGTTGT TGTTGGTTTG 
TTGCTTACAT GGGTGTTATG GCCATTGCCA TTGTACCGTG ATTGGATTTG GTCTGCTGCA 
TACTACAAAG GTTATGTTGT AGTTGGGTTA ATTTGGTTAT ACGTTGCCTT TATCATCATT 
GGGTTGGCTC CTATTTGGGA AGGTCGTCAT GCTATCAAGA CAGTCAGTAA TGGAATCTAT 
AGAGATTACA TCAAACGATC TAAGTAA

Protein sequence

MSDTDTVFLL PKGAGYGVLL GVGAVFAIGM ILTTKFLQKY LNENATSTET FSVADRSVKR 
FLACSSVYAS WSWADEILQT VSMIYNYGVQ ASFYYGAGLS VQMCVMALIG ISAKKRAPQA 
HTSLEIVGLR YGKATHILFL FLCLVTNLIS CSSMLLSASG AISIISGNLS IVASTLLIPF 
GVLLYTTFGG LKATFLTDYV HSFVLLLILI VINTKVLASK EIGGLNGLYS QLLEHSQDRY 
IEGNYQGSIL TGKSQGSIIF GLVLTCGNFG LTVMDSSFWQ KSFSAEVKAT VPSYLGSAVL 
IFANTWPIGA IIGGASIILQ GHPSFPTFPR KMTQFEIDSG FVLPYTVKAV LGNSGVGAVL 
LTVYLAVTST SSAQMISVSS ILSFDIYKKY INPQANNKQM IRVAHFGVVF FGLFAAGFTL 
MLHYVNVNMT WMGYFMSIVI CPGVFPLIFT VTWDRQTTIA AFVAPITGLV FGFAVWITTT 
NKLYGEITID TLGMQIPCLY ASLTALFLPA VVSIILSLTV FPKKFDWKEL SEAKLLIKAT 
GSESESESES EGEKSAIKEK STIENVQVFT VEEDLGVRAA DPAELNFYSK VAKIGVVVGL 
LLTWVLWPLP LYRDWIWSAA YYKGYVVVGL IWLYVAFIII GLAPIWEGRH AIKTVSNGIY 
RDYIKRSK