Gene PICST_41966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_41966
Symbol	GAP1.7
ID	4836951
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	973558
End bp	975486
Gene Length	1929 bp
Protein Length	621 aa
Translation table	12
GC content	46%
IMG OID	640388266
Product	general amino acid permease
Protein accession	XP_001382961
Protein GI	150864226
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0833] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.668272
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTATCTT CACTAGCATC GGGCCAGTCC TCCGATACCG GCTCGGAGTA TTCAGAATAC 
TCCGTCTACT CCAGAAGTTA CCATCCCAGG GACTTGTTCT ACGACTTCAT CGACTCGTTC 
AAGCCCTTCG ACTACTCCGT CTTACCACCT ATATACAATA CTGAGTCAGG AACTCATCAG 
GGGACCCACG ATATCGAAAA TCGCGATGTT CTGAACCTTG TAGCCAGAGA CACCCTTGTG 
TCAGACAAAC TGGTCCTTCA CCCCAACCAC CCACAATTTG ATTATTCACA TCTCACAGAG 
CTTGAGAGAG CGGCTTTGGT CACGGCAACA TCGCCCCTTT CAAAGCACTT GAAAACTCGT 
CATTTGACCC TTATCTCCCT TGGTGGTGCT ATCGGTACCG GGCTCTTCAT AGGTCTGGCT 
CTGTCCTTGA GCCATGCTGG CCCTCTAGGA ATGCTCTTGG TGTGGATCTT TATCGGCTCG 
ATCACCTTCA CGACGATGTC GTCACTTTCA GAATTAGCAA CTGCTTTTCC TATTGCTGGT 
TCCTTTGTCA CATTCACCAC ATTATTCATA GATGCCTCCT GTGGCTTCGC TATAGCTTGG 
AACTATGCCT TACAGTGGTT GGTAACCATG CCTCTAGAAC TTGTTGCAGT CTCGATGACA 
TTCTCCTATT GGAATACAGA TGTTCATCCG GCTGTGTATG TTGCCATCTT CTACGTAGTC 
ATTGTAGTGA TCAACTTGTT CGGTGTAAAA GGATACGGTG AGGCAGAGTC CTTGTTCAGT 
ATTATCAAAA TTATAGCCGT CATCGGCTTC AACATCTTGT CCATCATTAT AGTCACCGGG 
GGTGTCCCTG GACAACCCTA CATCGGAGGC AAGTACTGGC ATAAACCAGA AGGAGGGTTA 
TTTAACACTG TGGAGCCATT TAAACAATGC TGCTACATCA TTGCTAATGC CTCGTTTGCC 
TACGCTGGGG TAGAGATCTT TGCCCTTGCG GCAGTAGAAA GTAAGCAGCC TAAGAAATCG 
ATCAACAGCG CCAGAAAGCA GATTTTCTAC CGTATTCTTG TTTTTTACAT CTGTTCGCTT 
GTAATGATTG GTTTGCTTGT GCCCTACACA GACGAGAGAT TGTTGGGAAC TAACACTAAG 
GCCGGCAACA TTGGAGTTGA TATCAACACC TCTCCATTTG TAATTGCAAT CAAAAACGCA 
AACATCAGAG CATTGCCTAC TATCATGAAC ATCGTGATTA TAATCACTGT TGTATCAGTT 
GGAAATGCCA GTGTGTATGG CTCTTCTCGT GCCTTGTGTG CACTTGGAGC CTTGAGACAG 
GGTCCTTCTA TTTTGAACTT TATAGATCGT AGAGGTAGAC CAATGGCTGG ACTTCTAGTC 
CAGTTTGCCT TTGGATTGTT AGCCTTCTTG GTAGCAATTC CTGGCCCCAG TGTAACGACT 
CAGATCTTCA ACTGGCTCTT AAGTTTGTCT GGTCTCAGTA TCTTGTTCAC GTATTTGTCG 
ATTAACATCT GCCACTTGAG ATTCCGCAGG GCTTTGAATG TCAGAGCCAG ACTTCCTCAG 
GATGAACTTG TCTACACTTC ACCAGTGTGG GTATCGTGGT ATGCCATCAT CTGCATCATA 
ACTGTGTTGG GATTGCAGTT CTGGGCAGCT TTGTTCCCAC CAGGCAACCA CGCAGCAGAT 
TGGGAGAGCT TCTTGACCAT ATACTTGGGG TTGCCTGTGT TGATTTTGTT CTACATATGT 
CACAAGATCT ATGCCAAAAT CTTCTTGAAG GTGCCATTGA CTAAGTTTTG GCTCACTGCT 
GAAGAAATAG ATATCGACAC TGGAAGAAGA CAGATTGACA TGGAAGCATT GAAGCAAGAG 
ATTGCTGAAG AGAGATTGAG CTTCCAATCC AAACCATTGT ATTATAAGGT GTTCCGGTTT 
TTCTGCTAG

Protein sequence

MVSSLASGQS SDTGSEYSEY SVYSRSYHPR DLFYDFIDSF KPFDYSVLPP IYNTEDTLVS 
DKSVLHPNHP QFDYSHLTEL ERAALVTATS PLSKHLKTRH LTLISLGGAI GTGLFIGSAS 
SLSHAGPLGM LLVWIFIGSI TFTTMSSLSE LATAFPIAGS FVTFTTLFID ASCGFAIAWN 
YALQWLVTMP LELVAVSMTF SYWNTDVHPA VYVAIFYVVI VVINLFGVKG YGEAESLFSI 
IKIIAVIGFN ILSIIIVTGG VPGQPYIGGK YWHKPEGGLF NTVEPFKQCC YIIANASFAY 
AGVEIFALAA VESKQPKKSI NSARKQIFYR ILVFYICSLV MIGLLVPYTD ERLLGTNTKA 
GNIGVDINTS PFVIAIKNAN IRALPTIMNI VIIITVVSVG NASVYGSSRA LCALGALRQG 
PSILNFIDRR GRPMAGLLVQ FAFGLLAFLV AIPGPSVTTQ IFNWLLSLSG LSILFTYLSI 
NICHLRFRRA LNVRARLPQD ELVYTSPVWV SWYAIICIIT VLGLQFWAAL FPPGNHAADW 
ESFLTIYLGL PVLILFYICH KIYAKIFLKV PLTKFWLTAE EIDIDTGRRQ IDMEALKQEI 
AEERLSFQSK PLYYKVFRFF C