Gene PICST_34985 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_34985
Symbol
ID	4836922
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	1051390
End bp	1052505
Gene Length	1116 bp
Protein Length	371 aa
Translation table	12
GC content	45%
IMG OID	640388237
Product	predicted protein
Protein accession	XP_001382978
Protein GI	126132906
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0115] Branched-chain amino acid aminotransferase/4-amino-4-deoxychorismate lyase
TIGRFAM ID	[TIGR01123] branched-chain amino acid aminotransferase, group II

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.127685
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.13999
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTACTG CTCCATTAGA CTCAACCAAG TTGGTAATTG AGAAAACCAC TAATCCAAAG 
GAAGTGTTGC CTAAGGAAAA ATTGGCATTT GGAAAGTCTT TCACTGACCA TATGTTGGAA 
GTAGAATGGA CTGCTCAGAG CGGTTGGGGT ACTCCAAAAT TGTCGCCATA CCATAATTTT 
TCACTCGATC CAGCCACCTG TGTGTTTCAT TACTCTTTCG AATTGTTTGA AGGTATGAAG 
GCTTATCGTG ACAAGGATGG CAAGATCAGA ACATTCAGAT CAGACAAGAA CATGGAAAGA 
ATGAACGGCT CTGCCGCCAG AGCATCGTTG CCAACTTTCG ATGGAGAAGA GTTCATGAAG 
ATTATTGATA AGTTGTTGCT TGCTGATGAA AGGTTTGTGC CTGAAGGTTA TGGCTACTCA 
TTGTACTTGA GACCAACTTT GATTGGTACA ACTCCTGCTT TGGGTGTGGC TGCTCCTGAT 
AAGGCTCTAT TGTATGTAAT TGCATCTCCT GTGGGGCCAT ACTTTGCAGA AGGATTCAAG 
CCTGTTTCCT TAGAAGCCAC TGACTATGCT GTAAGAGCCT GGCCAGGTGG TGTTGGAGCT 
TTCAAATTGG GTGCCAACTA CGTCTCTTGT ATCCAGCCAC AAAGTGAGGC TGCCAAGAGA 
GGTCATTCCC AGAACTTGTG GTTGTTCGGC GAAGAGGGTT ACATCACTGA AGTTGGTGCC 
ATGAATGTAT TCTTTGTATT TCAGAATGCT GACGGCAAGA AGGAACTTGT CACTCCTCCT 
TTGGATGGTA CTATTTTACC TGGTGTAACA AGAGACAGTA CCTTAACTTT GGCTAGAGAA 
AAATTGAACT CAAACGAATG GATTGTATCC GAGCGCCCAT TGACAATCTA CGAAGTCAAG 
GAAAGAGCAC TCAAGGGTGA GTTAGTGGAA GCCTTTGGTA CTGGTACTGC TGCAGTTGTG 
TCTCCAATCA AGAACATCGA GCACCGTGGT GAAGCCATCG AGGTTCCAGT AGAAGATGGG 
AAGGCTGGAG CTTTCACTAA GCAAATCAGC GAATGGATCA GAAGTATCCA GTACGGTGAA 
GAGGATTTCA AGAACTGGTC GAGAGTTGCA AAATAA

Protein sequence

MTTAPLDSTK LVIEKTTNPK EVLPKEKLAF GKSFTDHMLE VEWTAQSGWG TPKLSPYHNF 
SLDPATCVFH YSFELFEGMK AYRDKDGKIR TFRSDKNMER MNGSAARASL PTFDGEEFMK 
IIDKLLLADE RFVPEGYGYS LYLRPTLIGT TPALGVAAPD KALLYVIASP VGPYFAEGFK 
PVSLEATDYA VRAWPGGVGA FKLGANYVSC IQPQSEAAKR GHSQNLWLFG EEGYITEVGA 
MNVFFVFQNA DGKKELVTPP LDGTILPGVT RDSTLTLARE KLNSNEWIVS ERPLTIYEVK 
ERALKGELVE AFGTGTAAVV SPIKNIEHRG EAIEVPVEDG KAGAFTKQIS EWIRSIQYGE 
EDFKNWSRVA K