Gene PICST_40468 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_40468
Symbol	UGA2
ID	4836942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	1860122
End bp	1861603
Gene Length	1482 bp
Protein Length	493 aa
Translation table	12
GC content	43%
IMG OID	640388257
Product	succinate semialdehyde dehydrogenase NADP+ linked
Protein accession	XP_001383128
Protein GI	150864352
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR01780] succinate-semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.920586
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.107865
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCCTA CTTTCAAGAA TCCAGATCTT ATCAAGACCA AGCCTTTCAT TAACGGCGAA 
TGGTTTGAAT CCAAATCCTC CAAATCCTTT TCGGTCTTCG ATCCTGCTAC CGGCGAAAAA 
ATTGCCGAGT TGCCTGATCA GACCCCAGAA GAAATAGACT ATGCCATCCA AGTAAGCGAA 
GATGCCTACC GCAAGTACAA GCTCACATCT ACTTACGACC GTTCGAAATG GTCTAGAAAC 
TTGTACAATC TTATCATGGA GAACGTTGAT GATTTGGCCA AAATCATCAC CTGGGAAAAT 
GGAAAATGTT TAACCGATGC TACCGGTGAA ATCAAGTATG CAGCTTCCTA CTTTGAATGG 
TTTGCTGAAG AAGCAAAGAG AAACTACGGG CACACAATTC AGCCATCGAA TCAAAACAAT 
AAGGTCATCA CCTACAAGCA GCCAGTTGGT GTTGTTGGTT TGCTTTGTCC ATTCAATTTC 
CCATCTGCCA TGGGTGCTCG TAAGGCTGCT CCAGCCCTTG CTGCTGGTTG TACTGCTATT 
CTTAAGCCAG ACGCCCAAAC TCCACTTTCT TCTTTAGCTC TTGCTTATTT GGCTGATAAA 
GCTGGTTTCC CTAAAGGAGT ATTTAATGTT GTCTTGGTTT CTGCTGAAAG CACCCCTACG 
TGCGGCTTGA AGTTCTGTGA ATCCAAGGTC ATCAAGAAAA TCAGTTTTAC CGGCTCTACT 
CCTGTTGGTA AGTTGTTAAT GAAGCAGTCT TCTTCCACAT TGAAAAAGTT GTCTATGGAA 
TTGGGTGGTA ATGCTCCTGT TATCGTCTTT GATGATGCCA AGTTGGACAT CGCTGTAGAA 
CAGGCTGTTG CTTCCAAGTT CAGATCATTG GGCCAAACCT GTGTGTGTGC CAATCGTATC 
TATATTCAGC TGGGAGTATA CAACGAATTC TGCCGTAAGT TCGTTGAAAA GGTCAAGAAC 
TTCAAGATCG GTAATGGTTT CGAACCAGGT GTCACCCATG CGTGCTTGAT CAACGAACGC 
TCTATCACCA AAGTCGAAGA TCATTTGCAA GATGCCATCC AAAAGGGTGC TAAAGTACTT 
CTTAAAGGAG GAAGACTTCC TGAGTTGGGT CCATTGTTTT ACGCTCCCTC TGTAGTTTGC 
GATGTTACCC AAGACATGAG AGTCATTAAC GAGGAAACAT TTGGACCTTT GGCTGCTTTG 
GTTAAGTTCG ACACGAAAGA AGAGGTCTTG CATTGGTGTA ATGATACTCC ATTTGGATTG 
GCTTCGTACG TTTTCTCTGA AAGTTTGAAC AACATCTGGT ATATGTCTGA ATACTTGGAA 
TCAGGAATGG TTTCTGTGAA CACTGGTATC TTCACTGATG CCGCTATGCC TTTTGGAGGT 
GTTAAGGAAT CAGGATTCGG AAGAGAAGGA TCTCTCTACG GTATGGACGA TTACACTGTG 
GTGAAATCTA TTACCTTGGG TAATGTCTAC CATCATGACT AA

Protein sequence

MAPTFKNPDL IKTKPFINGE WFESKSSKSF SVFDPATGEK IAELPDQTPE EIDYAIQVSE 
DAYRKYKLTS TYDRSKWSRN LYNLIMENVD DLAKIITWEN GKCLTDATGE IKYAASYFEW 
FAEEAKRNYG HTIQPSNQNN KVITYKQPVG VVGLLCPFNF PSAMGARKAA PALAAGCTAI 
LKPDAQTPLS SLALAYLADK AGFPKGVFNV VLVSAESTPT CGLKFCESKV IKKISFTGST 
PVGKLLMKQS SSTLKKLSME LGGNAPVIVF DDAKLDIAVE QAVASKFRSL GQTCVCANRI 
YIQSGVYNEF CRKFVEKVKN FKIGNGFEPG VTHACLINER SITKVEDHLQ DAIQKGAKVL 
LKGGRLPELG PLFYAPSVVC DVTQDMRVIN EETFGPLAAL VKFDTKEEVL HWCNDTPFGL 
ASYVFSESLN NIWYMSEYLE SGMVSVNTGI FTDAAMPFGG VKESGFGREG SLYGMDDYTV 
VKSITLGNVY HHD