Gene PICST_60303 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_60303
Symbol
ID	4839082
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	+
Start bp	695996
End bp	697297
Gene Length	1302 bp
Protein Length	433 aa
Translation table	12
GC content	45%
IMG OID	640390397
Product	predicted protein
Protein accession	XP_001384798
Protein GI	150865539
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0464] ATPases of the AAA+ class
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGGCT CTGCCGATTT CTTATCGAAG GGAATAGACT TAGTCCAGAA GGCTATCGAT 
GCCGACACTG CCACCCGCTA TGAGGAAGCT TACAAACTCT ACTACAACGG CTTGGAGTAC 
TTGATGTTGG CTATCAAATA CGAGAAGAAT CAGAAGTCCA AGGAACTCGT CAAGTCCAAG 
TTCACTGAGT ACTTGACTAG AGCTGAACAG TTGAAAGATC ACTTGGAAAA GCAACTGAAC 
AAGTCAAACT CTGCCGAAAG CTCATCAACG AACGGATCTA CAAAGGCAAA GAAGAGTGGC 
GACGGTGACG ATGACGATGC CGATACTAAG AAGTTGAGAG GAGCTTTAGC TGGTGCCATT 
TTGTCAGAGA AGCCCAATGT CAAATGGGAG GATATTGCTG GATTGGACGC AGCCAAGGAG 
GCGTTGAAGG AAGCCGTGAT TTTACCGGTC AAGTTCCCCC AATTATTCGT CGGGAACAGA 
AAGCCTACGT CCGGTATCTT GTTGTTTGGG CCTCCAGGTA CGGGTAAGTC ATATTTGGCC 
AAGGCTGTGG CCACCGAAGC CAACTCTACT TTCTTCTCAG TTTCATCGTC TGATTTGGTA 
TCCAAATGGA TGGGTGAATC CGAAAGATTA GTCAAGCAGT TGTTTACAAT GGCCAGAGAA 
AACAAGCCGG CCATTATCTT CATCGATGAA GTTGATGCTT TGTGTGGTCC CAGGGGAGAA 
GGAGAAAGTG AAGCGCTGAG GAGAATAAAG ACAGAACTAT TGGTTCAGAT GAACGGGGTT 
GGAAACGATT CTAGTGGTGT GTTAGTCTTG GGAGCAACCA ATATTCCATG GCAATTGGAC 
GCCGCCATCA GAAGAAGATT CGAAAGAAGA ATCTATATTG CTTTGCCAGA AGTAGAGGCC 
AGGACTAGGA TGTTTGAAAT CAATATCGGT GGTGTTCCTT GTGAATGTAC TCCTCAGGAC 
TACAAGGCCT TGGCCGAGAT GACTGATGGA TACTCTGGAC ACGATGTGGC CGTTGTAGTA 
AGAGACGCAT TAATGCAGCC TATTAGAAAA ATCCAGCAAG CAACCCACTT CAAGCTGGTA 
TTAGATGACG ACGGGAATGA AAAGTTGACT CCTTGTTCTC CAGGAGATGA TGGCGCAAGA 
GAAATGAACT GGATGGATAT TGGAACAGAC GAATTAAAGG AACCTCCATT GACAATTAAA 
GACTTCATCA AATCCATAAA GAGTAATAGA CCTACTGTCA ATGAAGCCGA TATTCAAAAC 
CACATTAAAT TCACCGAAGA TTTTGGTCAA GAAGGAAACT GA

Protein sequence

MSGSADFLSK GIDLVQKAID ADTATRYEEA YKLYYNGLEY LMLAIKYEKN QKSKELVKSK 
FTEYLTRAEQ LKDHLEKQSN KSNSAESSST NGSTKAKKSG DGDDDDADTK KLRGALAGAI 
LSEKPNVKWE DIAGLDAAKE ALKEAVILPV KFPQLFVGNR KPTSGILLFG PPGTGKSYLA 
KAVATEANST FFSVSSSDLV SKWMGESERL VKQLFTMARE NKPAIIFIDE VDALCGPRGE 
GESEASRRIK TELLVQMNGV GNDSSGVLVL GATNIPWQLD AAIRRRFERR IYIALPEVEA 
RTRMFEINIG GVPCECTPQD YKALAEMTDG YSGHDVAVVV RDALMQPIRK IQQATHFKSV 
LDDDGNEKLT PCSPGDDGAR EMNWMDIGTD ELKEPPLTIK DFIKSIKSNR PTVNEADIQN 
HIKFTEDFGQ EGN