Gene PICST_30449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_30449
Symbol
ID	4837925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	82260
End bp	83477
Gene Length	1218 bp
Protein Length	405 aa
Translation table	12
GC content	43%
IMG OID	640389240
Product	predicted protein
Protein accession	XP_001383651
Protein GI	150864711
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.903908
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.469416
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGGCTA CACTTTTGCC CAACCCCAAG GATACTAATG CCACAATTTT GTTGATGGGA 
TTAAGACGAG GTGGCAAGTC GTCTATTTGC AAAGTTGTAT TCCACAACAT GCAGCCTTTG 
GATACGTTGT ATTTGGAAAG TACATCCAAG CCCACAACAG AGCAGTTCAG CTCGCTCATA 
GATCTTTCGG TGATGGAATT ACCGGGTCAG TTGAACTACT TCGAGCCCAA TTACGACTCA 
GAAAGGCTCT TTTCGTCTAT CGGAGCTTTG GTTTATGTGA TTGACTCACA GGACGAATAC 
TTGAATGCTT TGACCAATTT ATCGATGATC ATAGAATTTG CATACAAAGT CAACCCCAAG 
ATCAACATTG AGGTATTAAT CCACAAAATC GATGGGTTGT CGGAAGACTA CCGTATCGAT 
GCCCAGAGAG ATATCATGCA AAGAACCGGC GACGAATTGT TGGACTTGGG GCTTGAAGGC 
GTGCAAGTGT CTTTCTACTT GACTTCTATT TTTGACCATT CTATCTACGA AGCATTTTCG 
AGAATCGTCC AGAAGTTAAT TCCCGAGTTG CCTTCCTTAG AAAATATGCT TGACAACTTG 
GTACAGCACT CATCTATCGA CAAGGTCTTT TTGTTTGACG TCAACTCCAA GATTTACGTA 
GCCACAGATT CGTCACCAGT AGACATTCAG ACTTACGAAG TTTGTGCCGA ATTCATTGAC 
ATTACCATCG ACCTTGATGA TTTGTATGTG GAAAACGAGT CTGGAACCAG AAAACAAAAT 
TCAACAAGTC AACAAAAGGA GCTCAAGTCT GTAAGTCATC TTTCAAACGG TTCCATATTG 
TACTTGAAGC AGATGATCAG AGGTCTAGCT CTTGTAGCCC TAATCAGAAA CGACGAAGTC 
CGAAACTCTG CCAACAATAC TACAAATACG AACAAGATAA ATAGCGACTT CAGTGACGAC 
AATGTCGACG TATTGGAGTC ATCTAGAACA AATAACCAGG ACAGTTCTTT GGCCATCATC 
GACTACAATG TAAATCTTTT CAAACAGGCC ATGATGCGGA TGTGGGAAAA CTCCAGATTC 
ATCAACCCCA ACGAGCCGCT AGAGCGTGGC TCTCTGGCGG AGTCCCATCT CTACGTTTCA 
GACAGCAATG GAGCAGGCAG TGGTTTATAT AAGGGTATCA ACAATAACGG CCTGACGACT 
CAAGATCACT TCAACTAA

Protein sequence

MEATLLPNPK DTNATILLMG LRRGGKSSIC KVVFHNMQPL DTLYLESTSK PTTEQFSSLI 
DLSVMELPGQ LNYFEPNYDS ERLFSSIGAL VYVIDSQDEY LNALTNLSMI IEFAYKVNPK 
INIEVLIHKI DGLSEDYRID AQRDIMQRTG DELLDLGLEG VQVSFYLTSI FDHSIYEAFS 
RIVQKLIPEL PSLENMLDNL VQHSSIDKVF LFDVNSKIYV ATDSSPVDIQ TYEVCAEFID 
ITIDLDDLYV ENESGTRKQN STSQQKELKS VSHLSNGSIL YLKQMIRGLA LVALIRNDEV 
RNSANNTTNT NKINSDFSDD NVDVLESSRT NNQDSSLAII DYNVNLFKQA MMRMWENSRF 
INPNEPLERG SSAESHLYVS DSNGAGSGLY KGINNNGSTT QDHFN