Gene PICST_29740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_29740
Symbol	DAL4
ID	4836842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	+
Start bp	1022656
End bp	1024251
Gene Length	1596 bp
Protein Length	531 aa
Translation table	12
GC content	42%
IMG OID	640388157
Product	allantoate permease
Protein accession	XP_001382424
Protein GI	126131798
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00893] d-galactonate transporter

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.895789
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.954692
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGGGG ACAAAGAGAA AAATGTCCAT GAGACAAACA TTACTGCTGT TGCCTCATTC 
ACTCGACAAG ACATTGGCAA GAATGAGAAT GTCATTACCA CAATCATCTC TCCTTTTACC 
TCACATGAAG TGAAACTTAC TGGCGATGTC GATGAAGCAT TGAAATTTGC CTTGGACCAT 
TCGGATGCAC AAGTGGTATT GACTCCAGAA AGAGATAGAA AGTTACTTTG GAAGATCGAT 
TTACACTTGA TGCCTATTTT ATGTTTATTG TACTGTTTCC AGTTCATGGA TAAATTGTCC 
AATTCCTATG CTTCAGTTTT GGGATTGAGA ACAGACTTGA GCATGCAAGG GGATATGTAT 
TCGTGGACTG GCTCTGCGTT TTACATCGGC TATTTGGTTT TTGAATTTCC AGCATCCCGA 
CTCTTGCAGA AGTTCCCAGT GGCAAAGACA CTTTCTATTT TCATCATTCT CTGGGGTATT 
ATCTTGATGC TCCATGCTAC TCCACAGTAT CCTGGCTTTA TTGCCTTGAG AACTATCTTG 
GGTATGCTTG AAAGTTCCGT AACTCCAGCT AACCTTCTAA TTACGGGTAG TTTCTACAGA 
AAGGAAGAAG TATTTCTCCG AGTTGCTTTA TGGTTTTCTA GTAACGGTAT AGGCACAATG 
CTTGGCTCTG GTGCTATAGC TCATAGCTTG GTCCAGTACG AGGACTCATA TAGTATCGCT 
CCTTGGAAAC TTACTTTTAT TATAACAGGA GCTTTGACGG TCGTAATTGG ATTCATATTT 
ATGTTCCATG TTCCAGATAC CCCTGCAAAT GCCTGGTTTC TTAATGAAGA AGAGAAAATG 
TTGGTTGTCG AAAGAATTAG AGCAAATCAA CAAGGGTTCG GAAACAAGCA CTTCAAGATG 
CACCAGTTTA AGGAAGCCAT GTTCGACATA AAGACATGGT TGATTGCACT TTTTGCATTT 
GCTTCCAACA TTCCCAACGG AGGGATTACC AATTTTGGAA GCATTTTGTT AACAGAAGAT 
CTAGGTTACT CCGTACCTGA AGGTTTGTTG ATGCAAATTC CCGCTGGTGC AGTGGAATTC 
GTAGGATGCT CACTCTTGGC TTTCGCAGCC AGTTATGTTG CAAAAAAGAG ATTATTCTGG 
GCCATGGTGG GTACAGTCAT CGCAGTTGTA GGAGAATGCT TTTTAGCATT TAGTAACAAC 
CATAAGCTCC AACTTGCCGG TTATATCCTC TACTCAATTG CCCCCGTTGG GTTTATCTGT 
CTCTTATCGA TTATTTCTTC GAATGTTGCT GGGCATACTA AGAAAGTGAC TACAAATGCA 
ATTTACTTGG TGAGCTACTG TGTTGGGAAT CTTATCGGCC CACAGACTTT CCTAGAAAGA 
GAGGCTCCCA ACTACAAGAC AGCCAAAATT TGTATTGCTG CCTTTGGAGT GTTTTCTATA 
GCCATCCTCG GTGCTATCTG GTTTGTATAC TGGTTTGATA ACAGATCACG TGATCGGATG 
AGTAGTGATG CCGCTGAAGA CTTTGCGCTT ATTGACAACC ACGAATTCGC GGATTTGACC 
GATAAGGAAA ATCCTTTATT CAGATACGAG TTGTAG

Protein sequence

MPGDKEKNVH ETNITAVASF TRQDIGKNEN VITTIISPFT SHEVKLTGDV DEALKFALDH 
SDAQVVLTPE RDRKLLWKID LHLMPILCLL YCFQFMDKLS NSYASVLGLR TDLSMQGDMY 
SWTGSAFYIG YLVFEFPASR LLQKFPVAKT LSIFIILWGI ILMLHATPQY PGFIALRTIL 
GMLESSVTPA NLLITGSFYR KEEVFLRVAL WFSSNGIGTM LGSGAIAHSL VQYEDSYSIA 
PWKLTFIITG ALTVVIGFIF MFHVPDTPAN AWFLNEEEKM LVVERIRANQ QGFGNKHFKM 
HQFKEAMFDI KTWLIALFAF ASNIPNGGIT NFGSILLTED LGYSVPEGLL MQIPAGAVEF 
VGCSLLAFAA SYVAKKRLFW AMVGTVIAVV GECFLAFSNN HKLQLAGYIL YSIAPVGFIC 
LLSIISSNVA GHTKKVTTNA IYLVSYCVGN LIGPQTFLER EAPNYKTAKI CIAAFGVFSI 
AILGAIWFVY WFDNRSRDRM SSDAAEDFAL IDNHEFADLT DKENPLFRYE L