Gene PICST_31639 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31639
Symbol	DAL8
ID	4838776
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	+
Start bp	1324576
End bp	1326135
Gene Length	1560 bp
Protein Length	519 aa
Translation table	12
GC content	41%
IMG OID	640390091
Product	allantoate permease
Protein accession	XP_001384207
Protein GI	150865120
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.338334
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.00000117277
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGTCTAAGG TTGTTGAAGT TGAAGATTCT ACAAACGATT CTGCTTCGTT CGGCTCAGAT 
AAGAAGGGCA AAACTGTCGA AGTTAAAGAG GAGCTTTTAA CTGAAAGTGA GCTCGCTGGG 
TATAATTTAT ATGAAAAAGC CCAAGAAATC AATTCGGAAG AAGAGCAGGC AATCAGCAAA 
AAGTTACTTT GGAAGGTAGA TAGAAGAATC GTCCCCTTAT TATGTATCAC TTATACATTG 
CAATTCTTGG ATAAGTTGTC TCTTAACTAT GCTGCCGCCT ATTCTCTAAA AGAGGATTTG 
AACTTGATTG GCCAACGTTA TTCGTGGGTT GCTGCTATCT TCAATTTTGG GTACTTGTTC 
TGGGCTCTTC CTGGCAATTA TATCATTCAG AGAGTTCCTG TAGCCAAATA TACTGGCTTC 
ATGTTGTTCT CCTGGTCTAT TATCTTGATT GGTCACATCG GTTTGAAAAA CTATGGGGGA 
GCTTTGGTTA TCAGATTCAT TCTTGGGATG TTTGAAGCGC TGATTAGTCC TTCTTGTATG 
AACATCTGCA GTTCGTTCTA CACCGTTAAA CACCAGCCAA TCAGAATGTG TATCTTCCTC 
TCGTTCAACG GTGTAGCTAC CATGGTTGGA GCTCTCTTGG GTTTTGCCTT GGGTCATGCC 
ACCAACTCTA GCTTGAAACC ATGGAAGCTT ATATTTATGG TCATTGGACT CATGAACTTT 
GTGTGGTCCT TGATCTTCCT CTGGTTGTGT CCTGATTCTC CAGATAAAGC CAAATTCTTG 
ACTGAAGAGG AGAGAGCAAT CTTAGTCAAA GAAGTAGCCT CCAATAACCA GGGTCTTAGA 
GATGTTAAAT TCAAGAAACA CCAGGCTATA GAAGCTATTA GTGATGTTGG GGTTTGGATA 
TTGGCATTTG TTGGTTTGGC TTGTGGAGTG ATTAACGGAG GAAGTTCCAA CTTCTCTTCT 
GCTTTGATTA AAGGGTTCGG TTTCTCTGGT TTGCAAGCAA CTGCGCTTCA ATTACCAACA 
GGTGCGATTG AATTAGTAGT AGTGGCCGCT ACTGGTTTTG CTGTATTCAG TTTTAAGAAT 
ACTAGAACTG TTGCCTTGTT CCTCATTTGT ATTCCTCCAT TGGGTGGTTT AATAGGAATT 
CACGTCATTT CTTTGGAACA TAAGTGGTCT TTGGTTGGTT GTACTTGGCT TCAATTCATC 
ATTGGAGGTC CAGTCATCTT GTGTTGGATC TTGTTAAATG CAAATGTTTC AGGTTCTTCA 
AAGAAGACAA TAGCAAATGG CTTATGGTTT GCTTTCTACG CTTCAGGGAA CATCATTGGT 
GCCAATGTTT TTTATACTTA CGAGGCTCCA AAATATCGTA GTGGTATGAT TGCCTTGATG 
ACATGCTACT GTGGTATAAT GGTTTTGGCT GTGGCGTACA GAGGTTTGCT TACGTTCAGA 
AACAAGAAGA AAATGGAAGA ACAGGGTGAA ATGACACCGG AAATGGAAGA ACAAGCTATT 
CTTGACGGGT TCAAGGGCTT GACTGATTTC GAAAACTCTG GTTTCCGTTA TGTATTATGA

Protein sequence

MSKVVEVEDS TNDSASFGSD KKGKTVEVKE ELLTESELAG YNLYEKAQEI NSEEEQAISK 
KLLWKVDRRI VPLLCITYTL QFLDKLSLNY AAAYSLKEDL NLIGQRYSWV AAIFNFGYLF 
WALPGNYIIQ RVPVAKYTGF MLFSWSIILI GHIGLKNYGG ALVIRFILGM FEASISPSCM 
NICSSFYTVK HQPIRMCIFL SFNGVATMVG ALLGFALGHA TNSSLKPWKL IFMVIGLMNF 
VWSLIFLWLC PDSPDKAKFL TEEERAILVK EVASNNQGLR DVKFKKHQAI EAISDVGVWI 
LAFVGLACGV INGGSSNFSS ALIKGFGFSG LQATALQLPT GAIELVVVAA TGFAVFSFKN 
TRTVALFLIC IPPLGGLIGI HVISLEHKWS LVGCTWLQFI IGGPVILCWI LLNANVSGSS 
KKTIANGLWF AFYASGNIIG ANVFYTYEAP KYRSGMIALM TCYCGIMVLA VAYRGLLTFR 
NKKKMEEQGE MTPEMEEQAI LDGFKGLTDF ENSGFRYVL