Gene PICST_80185 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_80185
Symbol	CAD2
ID	4851458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	1859869
End bp	1861161
Gene Length	1293 bp
Protein Length	331 aa
Translation table
GC content	43%
IMG OID	640393166
Product	CAD family protein
Protein accession	XP_001387596
Protein GI	126274586
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.101414
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GGTTTGGTAT CAATTGATAT TCTCTTGTCT GGCTTTTTCG AATTCTAATT GACACCATTC 
TAACTTCGAT TTCGCAATTA TAATCCGGAG TCGTTTCCCT AATTGGAATT TTTCAAGTAC 
TTATAATCGC TGATTTCCAG TTTTTCAGAA TCCCCATTCG GAGTATTTCG CTTTTCATTG 
AACTATTCTG CTTTCTGGAT ATTCAATTAA CCTCAATTGC TACTCAATAC ATATTACGTC 
ATGTCTGAAG TCTACTTAGT CACCGGAGGT ACTGGTTACG TTGCCGGATT TGTACTTCTC 
CAGTTGTTGG AACAGGGTGC AAAGGTCAAA ACCTCGATCA GAAGTTTGGC CAAAGAAGCC 
CAATTGAGAG AGTCTCTCTA CTCCTCAAGT GACAAGCTCA CGAAGGAAAT CGTGGATGCC 
AACTTGAAGG TCTATCAAGC TGATTTAACC TCTGACGCTA ATTGGCCAGA GATCTTTGAA 
GACGTCACCT ACGTACTCCA TGTAGCATCT CCATTTCCCT CTTCTCCACC AAAAGATCCT 
AACGATTTGA TTATTCCTGC TAGAGAAGGT ACCTTGAGAA TCCTCGGCTA TGCTGCTGAA 
ACCAACACTG TAAAGCACGT AGTCGTGACT TCGTCTTTCG CAGCCATTGG CTTTGGTCAT 
GCTGAAGTCA AGCCACTCTA CACTGAAAAG GACTGGACTG AAACGGAAAA CTTGGACCGT 
CCTTACACCG TCTCCAAGAC ATTGGCTGAA AAGGCTGCTT GGGAATACGT TGAAGCTAAA 
CCAGTCCAAT ATGGCTTGAC TGTGATCAAC CCAGTCTTGG TTATCGGACC TTCTTTGAAG 
AAGCAAGTTA CCAACTCTAC CTCCTTGAAC ATCATCCAGG GCTTGATCGA TGGCTCGAAG 
AAAAATGGTG TAGATCCATC TTCTGTCCAC CTTGTTGACG TTAGAGATGT TGCTAAGTTG 
CACATCTTGG CTTTGACCAC AGAAGAAGCT CTTGGTGAGA GATTCTTGGC TGCTACTGGT 
AGCACCCTTA CGTGGGTAGA TGCAGCTAAC ATCTTGAGAT CTAGAATCCC AGAGAAGTAT 
GTAGCTAACT TGCCTACAAA GGAAACTGGC CCTAGTGAAA CTCCTAAGTT GATTTCTGTT 
GAAAAGGCCA AGAAGACCTT CAACTGGACC CCAATCTCTG ACGAAGAGTC CTTGGTTGCC 
ACTGTCGAAG GCATTATCCA AGAAGGAAAG GTCTAGTAGG ACGTTTATAA CAATTTAAAT 
ATGCATATAA TGAACAATGT ATGTCATATA TTT

Protein sequence

MSEVYLVTGG TGYVAGFVLL QLLEQGAKVK TSIRSLAKEA QLRESLYSSS DKLTKEIVDA 
NLKVYQADLT SDANWPEIFE DVTYVLHVAS PFPSSPPKDP NDLIIPAREG TLRILGYAAE 
TNTVKHVVVT SSFAAIGFGH AEVKPLYTEK DWTETENLDR PYTVSKTLAE KAAWEYVEAK 
PVQYGLTVIN PVLVIGPSLK KQVTNSTSLN IIQGLIDGSK KNGVDPSSVH LVDVRDVAKL 
HILALTTEEA LGERFLAATG STLTWVDAAN ILRSRIPEKY VANLPTKETG PSETPKLISV 
EKAKKTFNWT PISDEESLVA TVEGIIQEGK V