Gene PICST_42095 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_42095
Symbol	ATG7
ID	4836974
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	1395895
End bp	1397853
Gene Length	1959 bp
Protein Length	652 aa
Translation table	12
GC content	45%
IMG OID	640388289
Product	Autophagy-related protein 7 (Autophagy-related E1-like activating enzyme ATG7)
Protein accession	XP_001383035
Protein GI	150864282
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0476] Dinucleotide-utilizing enzymes involved in molybdopterin and thiamine biosynthesis family 2
TIGRFAM ID	[TIGR01381] E1-like protein-activating enzyme Gsa7p/Apg7p

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0582833
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGATA GCGATAAGAC GGCCGCAAGA GTCGCACCAA AATATGTGCC CATTCTGTCG 
TTTGTAGAAC TGTCTTTCTT TACCAAATTA TCTGAACTCA AGCTTAACGA GTTCAAGCTT 
GATTCGTCCA AAAGAGACAT CCACGGGTTT ATCACCTCCC CCAGACGGCT CAATAAGTTC 
AATGACCAGC CCACTTTGAA TTTGGACTTG CAAAGCTTTG ATATTGCAGA AAAGGAAGCT 
AACAACCTTC ATATAAGCGG AGAGCTCTAC AATGTGAACA CCATAGAAGA GTTCAAAAAC 
ATCAACAAGC TGGACTTGCT CAACGACTGG GGCAAAGAGG TGTACACACG CCTTATACAG 
ACAGAGTCGT TGGATTACAA GGCGTTCAAT TGGTTTTTCA TCTTAACTTT TTCTGACTTG 
AAGAAGTACA AGTTCTATTA CTGGGTTGCC TTCCCCACAT TGAATGCTCC GTGGTTTGTG 
ACTTCGACCA GAGATGATTC CTTGGTAGAA AAACATACTA AAAACATCAC TAGACTCCTA 
GAGAATGATG GAGATTCCGA AAATCTTGCG TTCTCCCAAT TGTACCAAGT AGTAGGAGAG 
TCTTACTTAG ATTTGAATTC TATTCGTAGT AGTCGTAACG GTGTGTTTGT GTTTCTCGAT 
GGCTGTTTGA ACAAAGAAAC CAAACCCTCG GTCCAGTTGA AGAACTACCT CTACTTCTTG 
GCCTACAAAG GCTTTGAAGA CGTCGATGTG ATCGTATATA GAAACGACGG GTCCAGTTTT 
CAGGTTCATT ACGAGCTAGA CACTGATTCC TTCAACAAGA ACGTCCAGCC AAAGATAACC 
GGCTGGGAGA GAACGAGTCA GGGTAAGCTT GGGCCAAAAT TGGCAGATCT TGGCTCGTTG 
ATCAACCCGC ACCAATTAGC TGATCAGGCT GTGGATCTCA ATTTGAAGTT GATGAAATGG 
CGTATTGCTC CGGAACTCAA CCTAGACATC GTCAAGGAAC AGCGGGTACT TCTTCTTGGC 
GCAGGTACTT TGGGAAGTTA TGTGGCAAGG GCGTTAATGG GCTGGGGCGT GAGAAAGATT 
ACGTTTGTCG ATAATGGGCG TATCTCATAT TCTAACCCTG TACGGCAACC TTTGTTCAGT 
TTTAAGGATT GTTTCAGCGA TAATGGACAA GGTGAAATGA AGGCTGCACG AGCTGCTGAA 
GCCCTTAAGG AGATATTTCC TGGTGTAAGT TCTGAGGGTA TTAGTTTGGA AGTACCCATG 
ATTGGGCATC CGGTGAGCGA CGAAGCCAAA CTGAAGAGTA ATTTCGGAAC GCTTTCACAA 
TTGTTTGACG ACCATGACAT CATCTACTTA TTGATGGACT CGCGTGAATC GCGCTGGCTT 
CCCACGGTTC TTGGCTATGC TAAAAACAAG ATTGTCATCA ACGCTGCATT GGGGTTTGAT 
AGTTATTTGG TGATGAGACA CGGGAATTTA AGCCAACCAG AAGAGTCCAG GCTTGGTTGT 
TATTATTGTA ATGATGTTGT TGCACCCAAC GACAGTCTTA CCGACAGAAC GTTGGACCAG 
ATGTGTACCG TAACCAGACC CGGAGTTGCC CTTATGGCTT CTGCTTTGGC TGTAGAGTTG 
CTTGTTTCCA TCCTACAACA TCCTGATGGA AGCAAAGCTG CTCAGGATGA GAGCACCAAG 
TTTGGTGGTG TTCCTCACCA AATTAGAGGC TTCTTGCACA ACTTCCAGCA GACAAAGCTT 
TATGCTCCTA ACTACAAGCA CTGTTCAGCT TGTTCACACA CGGTGATCAG TAAGTTCGAA 
GAAGAGGGCT GGGAGTTTGT CAAGAAGTGT TTGAACGACT CGGGATACTT GGAGGAAATT 
TGTGGGTTGA AACAGGTCCA GGAAGAGGCC GAGAAGGCTA CGGAGGATTT GATGAAGGAT 
ATGGACTTAG ACGATGAAGA TTCTGAGTGG TTGGACTAG

Protein sequence

MSDSDKTAAR VAPKYVPISS FVESSFFTKL SELKLNEFKL DSSKRDIHGF ITSPRRLNKF 
NDQPTLNLDL QSFDIAEKEA NNLHISGELY NVNTIEEFKN INKSDLLNDW GKEVYTRLIQ 
TESLDYKAFN WFFILTFSDL KKYKFYYWVA FPTLNAPWFV TSTRDDSLVE KHTKNITRLL 
ENDGDSENLA FSQLYQVVGE SYLDLNSIRS SRNGVFVFLD GCLNKETKPS VQLKNYLYFL 
AYKGFEDVDV IVYRNDGSSF QVHYELDTDS FNKNVQPKIT GWERTSQGKL GPKLADLGSL 
INPHQLADQA VDLNLKLMKW RIAPELNLDI VKEQRVLLLG AGTLGSYVAR ALMGWGVRKI 
TFVDNGRISY SNPVRQPLFS FKDCFSDNGQ GEMKAARAAE ALKEIFPGVS SEGISLEVPM 
IGHPVSDEAK SKSNFGTLSQ LFDDHDIIYL LMDSRESRWL PTVLGYAKNK IVINAALGFD 
SYLVMRHGNL SQPEESRLGC YYCNDVVAPN DSLTDRTLDQ MCTVTRPGVA LMASALAVEL 
LVSILQHPDG SKAAQDESTK FGGVPHQIRG FLHNFQQTKL YAPNYKHCSA CSHTVISKFE 
EEGWEFVKKC LNDSGYLEEI CGLKQVQEEA EKATEDLMKD MDLDDEDSEW LD