Gene PICST_55023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_55023
Symbol	DUR4
ID	4837662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	+
Start bp	201284
End bp	203263
Gene Length	1980 bp
Protein Length	659 aa
Translation table	12
GC content	42%
IMG OID	640388977
Product	urea permease
Protein accession	XP_001382273
Protein GI	150863711
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.410596
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACCAA CCTTATCTCA AGGTGTAGCA TATGGTGTCA TCATAGGTGG CGGCGCATTC 
TTTGCCATAG TGATGAACTA TTTCACTCAC CTCCAGAACC GTTACAGTCG TTACAATTCC 
AACAAGATTG ATGAATTCGT TTCAGGAAGC AGATCCATAG GGTTCGGATT GCTTCTCAGT 
GGTATCTTAT CCAATTGGAC ATGGAGTTTA ACTTTACTTG AATCGGCTGT CAAGAGCTAC 
AATATGGGCT TCAGTGGAAG TTATTGGTAC GGTATTGGAG GTTTGTTGCA AGTTTCTGTC 
TTCTCTGTCA TCTCTAGTAA GATCAAGAAG AATGCAAATT TGGTCACCAC GTTTCCTGAA 
ATGGGCTATT TCAGGTTTGG AAGAGCTGGC CATTTAGCAT TCTTGTGGTG TGGATTCATT 
TGTAATGCCA TTGTCAGTTC GTGTATACTA CTTGGAGGTA GTGCAGTATT TCATGCTATA 
ACCGGTATTA ATCAATATGC TGCTCTCTTT CTTATTCCAT TTGGAGTTGC CGTATACGTG 
TCCTTCGGTG GATTGCGTGC TACATTCATT TCAGATGCTA CTCATACTTG TATAATTCTT 
GTCTTCTTAA TCGTTTTCAT GTTCGAAGTT TACGTTACCA ATCCAAAGAT CGGATCTCCT 
GAAAAGATGT GGGAATTGCT TGAACTGCTT TCTCCAGTCG ACGGAAACTA TAGCGGTTCC 
TACTTGACTT TTAGATCCCA ACAAGGTGCA ATATTTGCTG TAGTTAGTAT TATCACTGGA 
TTTGGCTTGG TTGTTAACGA CCAGGCGTAT TTGTCCAGAG CTGTTGCAGC AGACCCGAGA 
TTTACATCCA GAGCATACTT TTTTGCTTCA GTTTGTTGGT TTGTCATCCC TTTCTCAATA 
GGAACATCGT TGGGTCTTGC AGCTAGAGCT CTCACGGTAT ACCCTGATTT CCCTGCTTTG 
TCTGATTTCG AAGTCGGAGA AGGCTTACCA GCTGTAGCTG CTGCCACTTA TTTAATGGGT 
AAATCTGGAC TGGCAATGAT GATTGTGATG ATTTTCTTTT CAGTTACGTC GTCCTTTGCT 
GGCGAGTTGA TTGGTACTTC TACTTTACTT TCTTATGATG TCTATAAGAG GTATTACAAA 
CCAGATGCTA CTCCTAAAGA AGTTGTCACA GCAGCCAAAA TTTTTGTCTT CCTTTGGGCC 
ATATTTGCTT CATCTTTAGC TTCTATATTT TACGGTGCAG CAAAAATTTC CATGGGGTGG 
TTATTCAATT TCTTGGGAGT TGCTACTGCT TCTGGTGTCT TCCCCATTGC TCTTACATTC 
ACCTGGAAAA GATTGAATAA ATCAGGTGCT GTTGGTGGAT CTGTAGGAGG CATGGTATTG 
GCCCTAGTTG TCTGGCTCGT CACATGTAAA GCTAGCAAGG GTGAAATCAA TGTCACCAAC 
TTGTCAGATC AATGGGTCTC GTTTGCCGGT AATGTCACAG CCCTTATTCT GGGAGGCGTT 
ATTTCAATAG GATCATCTCT AATTTGGCCA TCTACATTCG AATTTGAAGA AACCAGAAAC 
AGAACAAGTT TGATTTCTGC ACCTGTTAAG AGTGAACCAG CGTTGAACGA AACCAAGGAA 
CAAAACGAAA AGAGCTCTGA CCTCAAAATC ACTGAAAGCG ATAAAGACAT TGAACTGGCT 
TCAGTAGATA CCGACTTGGA CATGGACCTT CACCAAGTGA TTGACCACCA GCATTTAGAT 
AGACAGTTCA AGAAGTACTG TGGTTTGGTT GCAATTCTTG CGGTTATCAT GACATTTATA 
ATCCCTGTTC CATTAGGAGC AAGCCCATAT GTTTTCTCGC CCGGCTTTTT AAAGGGCTGT 
GTCATAATTA TTATCGCCTG GCTATTCTTC TCATTTTCTT TCGTTGTTCT TCTTCCAATA 
TTTGAAGCTA GGAAAGAAGT ATGGAGAATT ACCAAGCTGG TTCTCTCTTT TGGACTGTAA

Protein sequence

MEPTLSQGVA YGVIIGGGAF FAIVMNYFTH LQNRYSRYNS NKIDEFVSGS RSIGFGLLLS 
GILSNWTWSL TLLESAVKSY NMGFSGSYWY GIGGLLQVSV FSVISSKIKK NANLVTTFPE 
MGYFRFGRAG HLAFLWCGFI CNAIVSSCIL LGGSAVFHAI TGINQYAALF LIPFGVAVYV 
SFGGLRATFI SDATHTCIIL VFLIVFMFEV YVTNPKIGSP EKMWELLESL SPVDGNYSGS 
YLTFRSQQGA IFAVVSIITG FGLVVNDQAY LSRAVAADPR FTSRAYFFAS VCWFVIPFSI 
GTSLGLAARA LTVYPDFPAL SDFEVGEGLP AVAAATYLMG KSGSAMMIVM IFFSVTSSFA 
GELIGTSTLL SYDVYKRYYK PDATPKEVVT AAKIFVFLWA IFASSLASIF YGAAKISMGW 
LFNFLGVATA SGVFPIALTF TWKRLNKSGA VGGSVGGMVL ALVVWLVTCK ASKGEINVTN 
LSDQWVSFAG NVTALISGGV ISIGSSLIWP STFEFEETRN RTSLISAPVK SEPALNETKE 
QNEKSSDLKI TESDKDIESA SVDTDLDMDL HQVIDHQHLD RQFKKYCGLV AILAVIMTFI 
IPVPLGASPY VFSPGFLKGC VIIIIAWLFF SFSFVVLLPI FEARKEVWRI TKSVLSFGS