Gene PICST_80440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_80440
Symbol	AAT1
ID	4851459
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	1861212
End bp	1862642
Gene Length	1431 bp
Protein Length	439 aa
Translation table
GC content	46%
IMG OID	640393167
Product	aspartate aminotransferase
Protein accession	XP_001387990
Protein GI	126274587
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1448] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CTACCCGTAG TACCCCTTCT TGTATCCCAA GCCCTTATAG AAGATGTATA GAACCTCGTT 
GCTCAAGCAG ACTGCACGTC CTTCCGTCCG AGTCTCCACC AGACAATTCT CAGTGCTCAA 
CAACCAGGTC AGAAAGTGGA GCGAAATCCC ATTGGCTCCT CCAGACAAGA TCTTGGGTAT 
CTCCGAAGCC TACAACAAGG ACGCCAACAC CTCCAAGATC AACTTGGGTG TCGGAGCCTA 
CAGAGACAAC TCCGGTAAGC CTATCATCTT CCCAAGTGTC AAGGAAGCTG AAAAGATCTT 
GCTTGCCAGC GAAGTTGAAA AGGAATACAC CGGTATCACT GGTTCCAAGA AGTTCCAGAA 
CGCCGTCAAG GGCTTTGTTT TCAACAACTC CGGCAAGGAT GTCAACGGTC AACAATTGAT 
TGAACAAAAC AGAATTGTCA CTGCCCAGAC CATCTCTGGT ACTGGTTCCT TGAGAGTCAT 
TGGTGACTTC TTGAACAGAT TCTACACCAA CAAGAAGCTC TTGGTTCCAA AGCCTACCTG 
GGCCAACCAC GTTGCCGTTT TCAAGGACGC TGGCTTAGAA CCAGAATTCT ACGCTTACTA 
CGAGACTTCC AAGAACGACT TGGATTTCGC CAACTTGAAA AAGTCCTTGT CTTCCCAGCC 
AGACGGCTCT ATTGTCTTGT TGCATGCCTG TTGCCACAAC CCAACTGGTA TGGACTTGAC 
TCCTGAACAG TGGGAAGAAG TTTTGGCTAT TGTCCAAGAG AAGAACTTCT ACCCACTTGT 
TGACATGGCC TACCAAGGTT TCGCTTCCGG TAACCCATAC AAGGACATTG GCTTGATCAG 
AAGATTAAAC GAGTTGGTTG TCCAGAACAA GCTCAAGTCC TACGCCTTGT GTCAATCGTT 
TGCTAAGAAC ATGGGTCTCT ATGGTGAAAG AACTGGTTCT ATCTCCATCA TCACTGAGTC 
TGCCGAAGCT TCTCAAGCCA TTGAGTCTCA ATTGAAGAAG TTGATCAGAC CAATCTACTC 
CTCTCCACCA ATCCACGGTT CCAAGATTGT CGAAATCATC TTTGATGAGC AACACAACTT 
ATTGAACTCG TGGTTGCAAG ACTTGGACAA GGTTGTTGGT AGATTGAACA CTGTCAGATC 
CAAGTTGTAC GAAAACTTGG ACAAGTCCTC TTACAACTGG GACCACTTGT TGAAGCAAAG 
AGGTATGTTC GTGTACACTG GTTTGTCTGC TGAGCAAGTT ATCAAGTTGA GAAACGACTA 
CTCGGTCTAC GCTACTGAAG ACGGAAGATT CTCCATCTCT GGAATCAACG ACAACAATGT 
CGAGTACTTG GCTAACGCCA TCAACGAAGT CGTCAAGCAG TAGACGTATA GATGGTCTGC 
TATTTTTTCT ACGAATTCAT AAATTATATA TCAATAAAAT GACTTATGGT T

Protein sequence

MYRTSLLKQT ARPSVRVSTR QFSVLNNQVR KWSEIPLAPP DKILGISEAY NKDANTSKIN 
LGVGAYRDNS GKPIIFPSVK EAEKILLASE VEKEYTGITG SKKFQNAVKG FVFNNSGKDV 
NGQQLIEQNR IVTAQTISGT GSLRVIGDFL NRFYTNKKLL VPKPTWANHV AVFKDAGLEP 
EFYAYYETSK NDLDFANLKK SLSSQPDGSI VLLHACCHNP TGMDLTPEQW EEVLAIVQEK 
NFYPLVDMAY QGFASGNPYK DIGLIRRLNE LVVQNKLKSY ALCQSFAKNM GLYGERTGSI 
SIITESAEAS QAIESQLKKL IRPIYSSPPI HGSKIVEIIF DEQHNLLNSW LQDLDKVVGR 
LNTVRSKLYE NLDKSSYNWD HLLKQRGMFV YTGLSAEQVI KLRNDYSVYA TEDGRFSISG 
INDNNVEYLA NAINEVVKQ