Gene PICST_36090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_36090
Symbol
ID	4838788
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	1646366
End bp	1647892
Gene Length	1527 bp
Protein Length	508 aa
Translation table	12
GC content	47%
IMG OID	640390103
Product	predicted protein
Protein accession	XP_001384620
Protein GI	150865414
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1362] Aspartyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGAAGA AGTTGTCCAC GGCAATTGAA GCTACTTCCG CTGGTTCCAG CTCCAGTTCT 
ACTGCTTCTA CTGCTAGTGC TCCAGCTCCT ACTCCTGTTT CTACCAGTAC TTCCAAGTAC 
TCTGACGATT ACTACGAAGC CCATGCTGAC GAATACATTA ATTTCACCTA TAAGTCGCCA 
ACCATCTACC ATGTGGTGGA CTACTTTGGA AGCAAGCTTG AACATGCTGG CTTTCTGTTC 
ATTTCTGAAA AGGAATCGTG GGACTCGATT AGACCTGGAA AGTACTACAC TGTCAGAAAC 
GGCTCTGCTT TAGCCGCGTT CATAGTTGGT GAACACTGGA AGCCCGCTAA GGGTGTTGGA 
ATCATTGGTT CGCACATCGA TGCGCTTACA GTGATTTTAA AGCCCAACTC TACCAAAGCC 
AAAGTAGAAG GTTACGAGCT TTTGGGTGTA GCCCCATACG CCGGTACTTT GGGCGATGTA 
TGGTGGGATA GAGACCTTGG GGTAGGTGGT AGATTGCTTG TGAAAGACAG TACTGGCAAG 
GTTGTGCCAC AGCTTGTAGA CTCTACCCCT AACCCTATTG CCCATATTCC TACTTTAGCA 
CCTCACTTTG GAGCTCCAGC TGTGGGTCCT TTCAACAAGG AAACGCAGGC CGTTCCCGTG 
GTTGGTTTCT CCACTGAAGA CCCAGAAGAA CCCACCGAAG AAGAAAAGTC CGCTCCTTTA 
TTTGGCAAAC ACCCTATGAC CTTGTTGCGT TACATTGCCA AAAAGGCCAA CGTCAAGGTT 
TCGGACATTG TCCAATGGGA CTTGCAATTG TACGACATCC AGAAGGGTGT CAAAGGAGGT 
TTGAATAAGG AGTTTGTTTT TGCACCCAGA ATTGACGACA GAGTCTGTTC CTTCGCAGCC 
ATCAACTCGT TGATTGAAGT CGATAACGAC CATTTGCTCA AGTCGGACTC GTTCTCGCTC 
GTGGGTCTTT TCGACAACGA GGAAATCGGT TCGGCAACTC GTCAAGGTAT CAAGGGTGGT 
TTGACTGAAT CTGTCATCAC TAGAGTCATC TCGTCTAACT ACTTCAACCC TAAATCCTAC 
GATGTTCAGG AACAAATCCG TTTGACTTAT GCCAACACCA TCATCTTGTC AGCTGACGTC 
AACCACTTGC TCAACCCCAA CTTTGCCAAC GTTTATTTGG AGCACCACAA GCCTGTTCCC 
AACACTGGTG TCACCATTGC CTTGGACCCT AACGGACACA TGGCTACCGA CTCCACTGGT 
TTAGCTCTTG TTGAAGAATT GGCCAAACTC AACGGCGATA CGTTGCAATA TTTCCAGATC 
AGAAATGACT CCAGATCTGG TGGTACCATT GGCCCTTCAA TTTCGTTGCA GACCGGAGCC 
AGAACCATCG ACTTAGGTAT CCCTCAACTC TCGATGCATT CTATCAGAGC TACTGTTGGT 
ACCAAGGATA TCGGTTTGGG AGTCAAGTTC TTTGCTGGTT TCTTTTCCAA TTGGAGAAAG 
ACCTACGACA GCTACAAGGA CTTGTAA

Protein sequence

MLKKLSTAIE ATSAGSSSSS TASTASAPAP TPVSTSTSKY SDDYYEAHAD EYINFTYKSP 
TIYHVVDYFG SKLEHAGFSF ISEKESWDSI RPGKYYTVRN GSALAAFIVG EHWKPAKGVG 
IIGSHIDALT VILKPNSTKA KVEGYELLGV APYAGTLGDV WWDRDLGVGG RLLVKDSTGK 
VVPQLVDSTP NPIAHIPTLA PHFGAPAVGP FNKETQAVPV VGFSTEDPEE PTEEEKSAPL 
FGKHPMTLLR YIAKKANVKV SDIVQWDLQL YDIQKGVKGG LNKEFVFAPR IDDRVCSFAA 
INSLIEVDND HLLKSDSFSL VGLFDNEEIG SATRQGIKGG LTESVITRVI SSNYFNPKSY 
DVQEQIRLTY ANTIILSADV NHLLNPNFAN VYLEHHKPVP NTGVTIALDP NGHMATDSTG 
LALVEELAKL NGDTLQYFQI RNDSRSGGTI GPSISLQTGA RTIDLGIPQL SMHSIRATVG 
TKDIGLGVKF FAGFFSNWRK TYDSYKDL