Gene PICST_31695 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_31695
Symbol	POL5.7
ID	4838556
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009044
Strand	-
Start bp	1455674
End bp	1457535
Gene Length	1862 bp
Protein Length	476 aa
Translation table	12
GC content	41%
IMG OID	640389871
Product	Putative RNA polymerase
Protein accession	XP_001384578
Protein GI	150865385
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.265783
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACAATC ATATGGCCCT TACCAACCTA TTGAACCTAG AAGTGCAAGG TCACATCACG 
GTTGACGACA CCGAGTCAAG TAAGAATCTT GTGAAGAATT GTATAACCTG CAACAGTATT 
ACTGTCAGAC AATCATCACA CAATCATCAC ACTCAACGCG CCGCTGTGCG CAGACTTGAA 
CGTGTGAGTT GCGATACTAT CGGACCTTTC CAATTTAGGA GATACAATAA GTCTACTGCA 
AAAATATTTA TCACTTCCGT TATTGATCAT TACACCGGTT ACACCAAACT ATTATATACT 
GATCACAAGT CTCTTGCAGA CACAGTATTA AATACTCTTA ATTTATGGAA TCATAAATTT 
CCTGGTGAAT CGATTTCATA TTTCCGGTCG GATAATGCAA TAGAACTTCC TTCTGACGAA 
CAACTACTTA AACTTGGAAT CGAACGCGAT CAAATTCCAC CGTATTCTCC AGAGCTAAAT 
GGATTGGCAG AATCACATAA TCGCATTATT CTTGCCAATA TACGGAAAGT TGTACTAAGT 
TTCCCCGATC GCCACGATGA AGTATTGACT CTCTTCAAAG AAATCGTGGA ATACTCGGCA 
TTCGTCAAGA ACAATACTCC CCGAAAGCTG CTCCAATATC GCACACCTGC CGCCGTCTTT 
TTTAACTATA AAGACGCATA TCACCGTCCT ATTGTCCCAT TCGGTATGGA CGTTGTGATA 
AAAGCATCTT CGAAAGAAGA ATACGAGAAG TATGGCCGTC CCTTACTTAA GACTGAACCA 
CACGCTTTCT TCGGTTCTAT CGTCGGCTTC GCCACAGATA ACTATAGCTA CCGAATACTC 
GTCCAAGCAG AACATTTCCC AATTATAACG AATTGTAATG CAAAACTCCT CAATTCACGC 
CAATTTATCG AGAATTATTT TCAATCACTT GATTTGTTAC AGAGAGACAG CGCTCAATAT 
AATGCCACAG TACTCGATGC ACTTGAAGAC AAACTTGCTG ATCATATCGA TATCGCTGAT 
AAAGAGGTTA TCTTTGATGC TACTTTACTT AAAAACGGGG ACACATCTGT CCAGACAGCC 
AACATTGGAG ACACCAATTT ATCGACGCCA TCTCCTCAAA ATCCTGAGGC TTTGAGCAAT 
ACACCTTCTT CGCAGATGAC GATCGAAAGT CTTTCTACAA GACATCCCGA AGTAGCCACT 
CAACACAAAC GGCGTATAGA AGAACTCACT TCTGACACGT TACCATTTCC TACCGATCAA 
GAAGGTAATT CGGTAGACGG AAAGCACATT AAGCGCTCAC CACGATTAGG GGGAGTAAAA 
ACAACTCCAC TTTCAGCCAC TAGAACGATC AGGGACCATA AGACTAAAAG TAAAATTGTT 
GATAACAATC GTGATTACGC TGCTGACCCC ATTAAAACTG CTATAGAAGA AACCAGAACG 
AAAATGAGTG AAGATCATAA CTTAAACTCA ACTACGACAA ATTCTGAAGA GTTAACTTCA 
CAGTTAGCCT CCCAGGAGGA TAGAATCTCA GGGGAGTTAT CAGGGGAAAC AAATGTGGAC 
TTATCAACCA CACCAGCACA AAATACAAGA TCACATACCA AGTCAAGACT AGACAAACAA 
ATTGAGCTGT CTAAAAATTG GTCTAACCTA GATACGCGAA AGACTCAATC ATGGAATAAA 
GTCCCACCTG AAATACACGG AAAGGGCAAA ATTAGTAAGA GGAAAGGTAC CAAAGCATCA 
TTATTGGACA AGGATGCACA AAGCTCACAA ATAGCAAAAA CGATCACCTC CGAAATAATA 
AAAAGAAAGA AGAAGACACC AGATTTCGAT TCCAGTCCAC AACAGATAAA TGCATTGCTT 
AG

Protein sequence

MYNHMALTNL LNLEVQGHIT VDDTESILSS DNHHTIITLN APSCADLNVF PDRHDEVLTL 
FKEIVEYSAF VKNNTPRKSL QYRTPAAVFF NYKDAYHRPI VPFGMDVVIK ASSKEEYEKY 
GRPLLKTEPH AFFGSIVGFA TDNYSYRILV QAEHFPIITN CNAKLLNSRQ FIENYFQSLD 
LLQRDSAQYN ATVLDALEDK LADHIDIADK EVIFDATLLK NGDTSVQTAN IGDTNLSTPS 
PQNPEALSNT PSSQMTIESL STRHPEVATQ HKRRIEELTS DTLPFPTDQE GNSVDGKHIK 
RSPRLGGVKT TPLSATRTIR DHKTKSKIVD NNRDYAADPI KTAIEETRTK MSEDHNLNST 
TTNSEELTSQ LASQEDRISG ELSGETNVDL STTPAQNTRS HTKSRLDKQI ESSKNWSNLD 
TRKTQSWNKV PPEIHGKGKI RCTKLTNSKN DHLRNNKKKE EDTRFRFQST TDKCIA