Gene PICST_39044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_39044
Symbol	DIP5.1
ID	4850778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	37424
End bp	38983
Gene Length	1560 bp
Protein Length	519 aa
Translation table
GC content	40%
IMG OID	640392486
Product	dicarboxylic amino acid permease
Protein accession	XP_001387660
Protein GI	126273512
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0833] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.115951
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

AATGAAATAA CTGATGAAGA TTCAATCTTT AAAGAAGACA GGGAAAGATT GTCCAAAGAC 
CTTCATTCTA GACACTTGCA AATGATTGCG ATCTGTGGAG TATTTGGTAC TGGTATCTTT 
CTTAGTTCAG GAAAGGTTTT TGCACTCACA GGTGCTGGAG GTACTTTCCT CGCCTATGCT 
TTGATGGCAA TTATAGTTGG AATTAACCAG ATAGCTATTG CGGAAGTTGC AGCTTTAATG 
CCGACTTCTT CTGCCACTGT TAGACACTTA GAACATTTTG TTGATCCGGC TCTAGGATTC 
GCCTATGGTT GGATTTCTGT CTGGCAAAAT GTCATGCCTG GTGAAATTGC TGCAGCCTCA 
GTTATTATAA CATTCTGGAC AGATATCAAT TCTGCTGCTT GGATTAGTAT TATTATTGTT 
GCACTTATCG CCGTTAATTC ATATTCGATG AAGTTATATG GAGAAATTGA GTTTTCATTT 
GCCATACTTA AACTTACTTT GTTGACAGGA TTGATTATAG TTTCAATAGT CATTACAGCT 
GGTGGAGGCC CAAATCATGA GTCTATTGGA TTTAGATATT GGAGGGATCC GGCACCATTT 
CTTTCTTATT TGACAACAGG AAGTCTTGGC AGATTTGCAG CCTTTTGGTC CTCGTTGAAT 
TCTGTAGTTT ACTCGTTTGG TGGAGTGCAA TCAGTTCCAA TATTAGCTAG TGAGGTCAAA 
TACCCTAGAA GAGCAGTTTT CAAAGCTTGC AAAAGAATCT TCTTTAGGGT TTCGATTTTG 
ATGACCTTGG CAGTGTTGTG TTTGACCTTA ATTGTTTCTC CAAGGGACAA GAACATCACT 
TCAGGTTCAG GAAATGCAAA ATCATCACCT TATGTTGTGG CTATCCAAAA TGCTGGTATT 
CCCGCATTAC CCCATATTGT GAATGCTGTT GTCTTTACTT CGGCTTTTTC TGCTGCTAAT 
GCTGGTGTTG TCCAGGCTTC TAGAGTTCTT TTCGCTTTGG CTGTCAAACG TCAAGCCCCA 
TCTTTCTTCT TGAAGACCAC CAAGAGAGGA ATACCTATCT ATGGTTTGGC ACTTGTTGCT 
GTATTCATGC CCTTGTCTTA CATGTCAGTG TCCAAAACTG CAGCAACGGT TTTCAATTGG 
TTCCAAAGTT TGACCTCTTC AAATTTGTTA TTAGGATGGA TTTTGATTGG GGTCAACCAT 
GCTTCACTTC ATAGAGCTCT CAGAGCTCAA GGCTACTCCA GAAGCAATTT ACCTCATACA 
GTGCCAGGAG GTGGTTATGC AGGTTACTTT TCAGTAGTCG TATGTTCCAT TTTGCTTTTG 
ACCAATGGGT ACACAAATTT TGTACATGGA CATTTTGACA TCGCCAGCTT CTTTTCTTCC 
TACTTTATCT TGCCATTGTT CTTTGGCTTG TACGTGTTTT GGAAATTTTT CAAAAGAACT 
GAATTCATTA CACCCGACAA AGTTGATTTA CACTCTTTGT TCCTTGACGT TGAGAGGAAC 
CCTGAGCCTC CACAAGTGCC ATTACGTGGA TGGAAATGGA TAACAATATT ATGGGATTGA

Protein sequence

NEITDEDSIF KEDRERLSKD LHSRHLQMIA ICGVFGTGIF LSSGKVFALT GAGGTFLAYA 
LMAIIVGINQ IAIAEVAALM PTSSATVRHL EHFVDPALGF AYGWISVWQN VMPGEIAAAS 
VIITFWTDIN SAAWISIIIV ALIAVNSYSM KLYGEIEFSF AILKLTLLTG LIIVSIVITA 
GGGPNHESIG FRYWRDPAPF LSYLTTGSLG RFAAFWSSLN SVVYSFGGVQ SVPILASEVK 
YPRRAVFKAC KRIFFRVSIL MTLAVLCLTL IVSPRDKNIT SGSGNAKSSP YVVAIQNAGI 
PALPHIVNAV VFTSAFSAAN AGVVQASRVL FALAVKRQAP SFFLKTTKRG IPIYGLALVA 
VFMPLSYMSV SKTAATVFNW FQSLTSSNLL LGWILIGVNH ASLHRALRAQ GYSRSNLPHT 
VPGGGYAGYF SVVVCSILLL TNGYTNFVHG HFDIASFFSS YFILPLFFGL YVFWKFFKRT 
EFITPDKVDL HSLFLDVERN PEPPQVPLRG WKWITILWD