Gene PICST_62767 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_62767
Symbol
ID	4839886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	-
Start bp	56712
End bp	58139
Gene Length	1428 bp
Protein Length	475 aa
Translation table	12
GC content	46%
IMG OID	640391201
Product	X-Pro dipeptidase
Protein accession	XP_001385698
Protein GI	150866190
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.106037
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGGTC CTCCTTCTTT AGTCGGAAAG AAATACCCAG CCAAACAGCA TGCCCGCACG 
GTCTACTCCC ACTTGGTTCA CAAGAACGAA GTTTCCGCCA AAGGCAGTGC TTTCTTCGTT 
TCCGGAGAAG ACTTGGAATT GTACCTCTAC TGCGACCAGA CCAAGCCGGT CAGACAAAAT 
CGGTACTTCT TTTACTTGAC TGGATGTGAC ATTCCAGGAT CTCACGTGTT GTATAACACT 
GTCAAGGATC ACTTGACCCT CTACTTGCCC GACATAGATT ACGAAGATGT CATGTGGCTG 
GGGCTCCCTT TGTCGCTTGA AGCTGCAGCC GAAAAGTTTG ATGCAGACGA AATCAAATAT 
GCATCGGCGT TGCATGCTGA TTTGGAAGAA TTCCACAACG ACAAGGTGAC AATTTTCACC 
ACGGACATCA ACAAGTTCAA CACAAAGTAT GAGGGCTTTT TGCAGCCCGG AAACAAGGAT 
TTCTTCTATG CTTTGGACGA ATCACGTTTG ATCAAGGATT GGTACGAAAT CGAATTGATG 
AAGCACGCAG CCAAGATCAC CGACAACTGC CATTTCGCCG TGATGTCTGC TACTCCTATT 
GAAACCAACG AAACCCACAT CCATGCTGAG TTCTTGTATC ATGCATTGAG ACAAGGTTCA 
AAGTACCAGA GTTATGATCC TATTTGCTGC GCTGGCGAAA CTTGTTCGAC TTTGCACTGG 
GTCAAGAACG ATGAAGAAAT CACTCCAGAC AAAAAGTCGG TATTAATAGA TGCCGGCGCC 
GAATGGAGCT GTTATGCCTC GGATGTCACC AGATGTTTCC CCATTAATGG TGATTGGACC 
AAAGAGCATC TTGAGATCTA CAACGCTGTA TTGAAGATGC AATCGGTGAC CAAGGAAATG 
ATCAAACCTG GAGCCAGCTG GGATGTACTC CACTTAACAG CCCACAGAAT TATGATTGAA 
GAGTTCTTGA AGTTGGGAAT TTTCAAAAAG GAGTATACCG TAGATGAACT CTTTGAGTCT 
AAAGTCAGCG CCCGTTTCTT TCCACACGGA TTGGGCCATT TACTTGGAAT GGATACTCAC 
GACGTAGGAG GATACCCCAA TTACTCCGAC CCAGATCCCT TGTTGCAGTA TTTGAGATTG 
AGAAGAGATT TGCAGGCCGG TATGGTGTTG ACCGACGAGC CAGGAATTTA CTTCTCGCCT 
TTCTTGTTGG AAGACACCTT GAAGGACCCA ACCAAGGTCA AGTACATCAA TAAAGATGTC 
TTGGACAAGT ACTGGTACAT TGGAGGTGTT AGAATTGAAG ATGATATCTT GGTCACCGAA 
GATGGATATG AAAACTTCAC TGGCATTACC TCTGATCCAG AGGAAATCTC AAAGATTGTA 
AGGGCTGGGC TTGCTAAGGG CAAGGAAGGC TTCCACAATG TTGTATAG

Protein sequence

MSGPPSLVGK KYPAKQHART VYSHLVHKNE VSAKGSAFFV SGEDLELYLY CDQTKPVRQN 
RYFFYLTGCD IPGSHVLYNT VKDHLTLYLP DIDYEDVMWS GLPLSLEAAA EKFDADEIKY 
ASALHADLEE FHNDKVTIFT TDINKFNTKY EGFLQPGNKD FFYALDESRL IKDWYEIELM 
KHAAKITDNC HFAVMSATPI ETNETHIHAE FLYHALRQGS KYQSYDPICC AGETCSTLHW 
VKNDEEITPD KKSVLIDAGA EWSCYASDVT RCFPINGDWT KEHLEIYNAV LKMQSVTKEM 
IKPGASWDVL HLTAHRIMIE EFLKLGIFKK EYTVDELFES KVSARFFPHG LGHLLGMDTH 
DVGGYPNYSD PDPLLQYLRL RRDLQAGMVL TDEPGIYFSP FLLEDTLKDP TKVKYINKDV 
LDKYWYIGGV RIEDDILVTE DGYENFTGIT SDPEEISKIV RAGLAKGKEG FHNVV