Gene PICST_72069 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_72069
Symbol	DAL7
ID	4838665
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	+
Start bp	947951
End bp	949892
Gene Length	1942 bp
Protein Length	520 aa
Translation table	12
GC content	41%
IMG OID	640389980
Product	putative MFS allantoate transporter
Protein accession	XP_001384136
Protein GI	150865072
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.145167
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TAACGCTAAA ACATTGTCCG CTGCAACTCT TCATCACCCC AAGACTTCCC GCCCCTTAAG 
CCGTTCATTT TTTCTTCACT AAATGAAATT TCACTTAGGC ACTGTCTAAC TACTATTTAG 
TATCACCTGA ACACCGAGAT TTCTCGGAAA GGCAGCAAAT AATTTCTGCT AAAGTATCTC 
CTTTTCTTTC AGATTTGATA GTGTGTGTTC TTTCGTCGTT TCCGCCATCC TTCTATACGT 
TTCTCATTGA TAGACCATTG TCTCTTGGGT CTTACGTACT TATTTAGGTG CAGAACCAGA 
ATTTTGTCTT CCTATAGCTG TTAAATACTT CAGAATGGGT GGATGGACGA TTGTTGGAGA 
CTCTTTCAAG GGAGGTGATG TGAAGCTAGT GACTGAACAT TTAATTGAAC TGTCCCGGAA 
GTCGAATGTA GACTATGGTG CCGAATTTCT CGCTGAAAAC GAACACCAAT ACCCTCCGGC 
GACCGAAGAT GAAGAAAGAA GAATTATAAA AAAACTTGAT TTCATCTTGG TACCGATGCT 
TTTCTTCACA GCGACGATGG GAGCAGTTGA CAAGGTTTCC CAGGGTACAG CGGCGATTTA 
TGGCTACATT CCGGACAATA ATTTAACAGG ATCTCAGTAT TCCTGGCTAG GATCAATTCT 
TTTCCTTGGT TCCTTAGTCG GGATGTTCCC CATGTCCTTT TTCTTGCAGA GGTTTCCATT 
GGGAAAAGTT CTAGTAACCG CTTCACTTTT CTGGAGTAGT TTAACACTTC TATTGTGTGT 
TGGTAGAAGT TTCGCTGGGT TGGCTGCTAT TCGGTTTCTT ATGGGGTTTG TCGAATGTGC 
TATTGTCCCT GGGTGTACTC TTGTCTGCGG AAGATTTTAT TCCAAGGGAG AAATTGCTAC 
TCGTTTGGCT TTTGTTTTTG CCTTTGCTTC TTCAGTTATT AATGGGTTTT TGTCATGGTT 
GGTTGGTTAT TTTCATCATT CCACAGTCCC AGCCTGGAAG TTTCTCTACA TCTTGGTGGG 
TTCTATTTCA TTTCTTTGGG GTTGTCTCAT GTGGGTATAT TTGCCAGATT CTCCCTTGAA 
CGCCAAATTT CTTACCAACC AAGAAAAGGT CTACGTCGTG AGACGGATTA TCAGAAAAAG 
CAATGGCGGT GTTCAGAATA ATAATTGGGA TTGGCAACAA GTCAAGGAGG CAGTTCTCGA 
CAGCAAAACT TATGTCATAT TCTTTTTCAA CATTGGTATA AATATTTGCA ATGGTGGTCT 
CTCAACGTTT TCTTCCATAA TCATTTTTAA CCTTGGATTT AATGCAATGA AAGCATCGTT 
GATGGGTATT CCAACAGGTG TCATTGCAAC CCTTGCTACC ATTTTCTTCA CGTTTTTATG 
TAACAAATTC AACAACAAGC GTTGCTTGAT TGCAATTATT TCACTTATAC CTCCGGTTGT 
TGGGTCAGCT ATCATATATG CCGTGGACCG GCTGAACGTG GCACCGCAAT TGGTTGGTCT 
CTACTTGCTT TATTTCTACT TTGCTCCGTA CGTCGTGATG ATGTCCCTTG CCCAAGCTAA 
CACTTCTGGA AACACCAAGA AATCTGTCAC CTATTCTATC AATTATTTGG GTTATTGTGT 
GGGAGCTCTT ATTGGCCCTC AAACTTTTAG GGCTAACCAG GCTCCAAGAT ACACTGGAGG 
TTTTATCGCC TTGCTTTGTT CTTTCCTTAT TTGCATGATG TTTGCTGGCA TATATTGGGC 
GATATGTATT TGGGAGAATT CCAAGAAATC GAGGAAGTAC GACGAAAACG AAGTGTATCT 
GGAAAAGCCG GTGTCCAGAG ATGAAAAGGA GATTGACGAT GAGGAATATT ACGATCTATC 
TGATTCCCAG CGAAAGCATT TCCGTTACAC TACATAGTAA TTAGAGTACA ATTAATTTAA 
TTCAACGACT TATAAGACTT TC

Protein sequence

MGGWTIVGDS FKGGDVKLVT EHLIESSRKS NVDYGAEFLA ENEHQYPPAT EDEERRIIKK 
LDFILVPMLF FTATMGAVDK VSQGTAAIYG YIPDNNLTGS QYSWLGSILF LGSLVGMFPM 
SFFLQRFPLG KVLVTASLFW SSLTLLLCVG RSFAGLAAIR FLMGFVECAI VPGCTLVCGR 
FYSKGEIATR LAFVFAFASS VINGFLSWLV GYFHHSTVPA WKFLYILVGS ISFLWGCLMW 
VYLPDSPLNA KFLTNQEKVY VVRRIIRKSN GGVQNNNWDW QQVKEAVLDS KTYVIFFFNI 
GINICNGGLS TFSSIIIFNL GFNAMKASLM GIPTGVIATL ATIFFTFLCN KFNNKRCLIA 
IISLIPPVVG SAIIYAVDRS NVAPQLVGLY LLYFYFAPYV VMMSLAQANT SGNTKKSVTY 
SINYLGYCVG ALIGPQTFRA NQAPRYTGGF IALLCSFLIC MMFAGIYWAI CIWENSKKSR 
KYDENEVYSE KPVSRDEKEI DDEEYYDLSD SQRKHFRYTT