Gene PICST_30704 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_30704
Symbol
ID	4838157
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	727829
End bp	729559
Gene Length	1731 bp
Protein Length	576 aa
Translation table	12
GC content	44%
IMG OID	640389472
Product	predicted protein
Protein accession	XP_001383772
Protein GI	150864797
COG category	[K] Transcription
COG ID	[COG3343] DNA-directed RNA polymerase, delta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACTA TGTCCACAGC TACGACTCCC ACGATGAGTC CGAACCATTT GATCACGTCT 
CCCAATATCA CACTTAATAG TTCCAATAGC AATAATATAT CATATTCGTC ATGTTTAGCC 
ACCAATACCA TTTCACACGC TGGCTCTTCC AATATCGGTG GCCATTCACA AAATCTGTCT 
GGCTCCCAGT CGCAGAGCCA ACAACCCTCT TCAAGCCTGG CATCTTCTGG ACGTACACCA 
TCTGATCGTT CAGACCGTAA ACTTGCCGTT CCCAAAAGTT TGACATCACA TTCATCTCCT 
TCTTCATCGT CTTGTTCATC ATCCTCATAT TCATCTTCTT CTACTAAGAG TAGTCCCTTG 
ACTCAACACA TTGATCCATT TCTTGCCCAG TACCTCAAGT CACCTACCAT TAATTCTACT 
TTCACCAACC ACCGCCTTTT TTTCCAGGCG CTCAATAGAG AACGGAAAAT CAAGCTGATG 
GACATCTACC TGAAGTACTT GACGTTCAAA CACACTAAGA ACCCATACAA GAACGCCCAG 
ACATACCAAC AGTACATCCA GAGAAATGAC CCACCCAAAA TCAGGATCAA GTCGTCGCCC 
TTGATATCTC AAAAATATCA AAATTATCAT CACCATCACC ATGAGCATAA CCAGAAAACC 
CAGACTTTGA AGAAGTTACC TTCCCCTATG ATTACTCTTG AGAAAACGTT GCTGCCTTCT 
CCCAAGAGAA AATTTCCAGA ACCAGTGCCT CAAGTCCAAG TAGTCAAGAA ATTCCTTCCC 
CCACAGTTCA TGGACTGTCC TACGGACGAC TTAATAAACT TGATTTCGCG AATGTTGCTG 
TCCCTCATAT CGTTGAATGA TAAGTCTGTG CCCGAGTCGA TATCTCACCC AAAGCCATCT 
TCAGCAGCTT CGACGAACAG CTTATTGACA AGATACCATT CGCGTACACC TCCTAGCATT 
TCTACCCATA CATACTTGAC AAGATTGAGT CAGTATAACA ACTTCAACCC AGCAACGTTG 
CTCACAACCA TCTATTACAT CGACTTGTTG AGTCACCAAT ACCAGCCATT TTTCACGTTG 
AACTCGTGGA CGGTACATCG TTTTCTTCTT GTAGCTACTA TGTTGTCGCA AAAGTCCATG 
GAAGACTTCT TCTACACAAA TGACCACTAT GCCAAAGTTG GAGGTGTGGC TGTAGGCGAA 
TTAAATTGTT TAGAGTTAGA TTTCTTGAAC CGCGTGGACT GGAGGTGTAT TCCAGGAAAA 
CAGCATTTGC AGGGTCAAGG TCAAGAAAAA GAACACCAAT ACTGCAGTAT CAGATACGCG 
AAGGACGTCT TAGATCTCTA CTACATCCAG TTGATCGAAT TGATGGGTAG ACACACCGTA 
AACAGCGATC CGTTATCGAA GCATATTCAT TACTTGCCTC AGAGTAAAAA CGAAAATTCC 
TCTAAAAATG CCGACGGTAT TGAAATTGAA CAGGAGGAAG AACAGAACGA AGAAGATATG 
GACGAGGAAG AAGATGATGA AGAAGATGAT GACGACGACG ACGACGATGA CGATGACGAT 
GACGATGATG AGGACGAAGT CAATTCAAGC AGCCAGGCTG TAGAAGATGA AGACGAAGAA 
GAAGAGGAAA GCAGAAACGG ACTCAGGAAG AGTCCACTAT TTGATTCAGA CGGCTATAGT 
GTCGACGGAA CTTCGTCACC ACACTTGAAG AGGAAGTATT CCAACGAATA G

Protein sequence

MTTMSTATTP TMSPNHLITS PNITLNSSNS NNISYSSCLA TNTISHAGSS NIGGHSQNSS 
GSQSQSQQPS SSSASSGRTP SDRSDRKLAV PKSLTSHSSP SSSSCSSSSY SSSSTKSSPL 
TQHIDPFLAQ YLKSPTINST FTNHRLFFQA LNRERKIKSM DIYSKYLTFK HTKNPYKNAQ 
TYQQYIQRND PPKIRIKSSP LISQKYQNYH HHHHEHNQKT QTLKKLPSPM ITLEKTLSPS 
PKRKFPEPVP QVQVVKKFLP PQFMDCPTDD LINLISRMLS SLISLNDKSV PESISHPKPS 
SAASTNSLLT RYHSRTPPSI STHTYLTRLS QYNNFNPATL LTTIYYIDLL SHQYQPFFTL 
NSWTVHRFLL VATMLSQKSM EDFFYTNDHY AKVGGVAVGE LNCLELDFLN RVDWRCIPGK 
QHLQGQGQEK EHQYCSIRYA KDVLDLYYIQ LIELMGRHTV NSDPLSKHIH YLPQSKNENS 
SKNADGIEIE QEEEQNEEDM DEEEDDEEDD DDDDDDDDDD DDDEDEVNSS SQAVEDEDEE 
EEESRNGLRK SPLFDSDGYS VDGTSSPHLK RKYSNE