Gene PICST_28701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_28701
Symbol	LYS21
ID	4851460
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	-
Start bp	1865914
End bp	1867269
Gene Length	1356 bp
Protein Length	451 aa
Translation table
GC content	46%
IMG OID	640393168
Product	homocitrate synthase
Protein accession	XP_001387991
Protein GI	126274588
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR02146] homocitrate synthase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.453642
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAATGG ACTCGGTAAT CGACGGGTTT CTCAAGTTTG ATCTGGAATA TACGGAAATA 
ACGTACAATA ATCCGTATGG TCCCAATCCT GCTGATTATC TTTCAAATGT ATCACATTTC 
CAGGTTATTG AGTCAACATT ACGAGAAGGG GAGCAATTTG CAAATGCTTT TTTTCTGACG 
GACACAAAGA TAGCCATTGC AAAGGCGCTC GACGACTTTG GTGTCGATTA TATTGAGTTG 
ACATCTCCTG TAGCCTCTGA GCAGTCTAGG AGAGACTGTG AGGCCATATG CAAGTTGGGT 
TTGAAAGCGA AAATATTGAC CCATATACGG TGTCATATGG ATGATGCACG AGTAGCAGTT 
GAGACGGGTG TGGATGGTGT TGATGTTGTT ATAGGAACAT CTCAGTTTTT GCGAGAGTAT 
TCGCACGGGA AGGATATGAC ACACATCACC CAGAGTGCCC TAGAGGTGAT CGAGTATGTG 
AAGTCTCATG GAATAGAGAT TCGTTTTTCT TCAGAGGATT CGTTTCGGTC GGAGTTGACT 
GACTTGCTTA GCATTTACCG GGCTGTAGAC AAAGTCGGTG TAAATCGTGT AGGTATAGCA 
GATACTGTTG GATGTGCCAA TCCCCGGCAA GTTTATGAGT TGGTAAGAAC TTTAAAGGGT 
GTAGTGAGTT GTGATATCGA GTGTCATTTC CACAATGATA CTGGTTGTGC TATTGCCAAT 
GCGTACACTG CTTTGGAAGG TGGAGCCAAG TTGATCGATG TGTCGGTATT GGGCATTGGC 
GAGAGAAACG GCATTACTCC TTTGGGAGGA CTAATGGCTC GGATGATCGC AGCTGATCGT 
GACTACGTCC TCTCCAAATA CAAGTTGCAC AAGCTACGAG ACATTGAAAC GCTTGTGGCC 
GAGTCTGTGA GAGTCAACAT CCCGTTCAAC AACCCTGTGA CTGGCTTTTG TGCTTTTACT 
CACAAGGCTG GAGTTCATGC CAAGTCGATT TTGGCTCCTC CTTCGGAGTA CGAGATATTG 
AGTCCCTCGG ACTTTGGTTT GACCAGGTAC ATCCACTTTG CCAACCGGTT GACGGGTTGG 
AATGCCATCA AGTCACGAGT GGACCAATTG AATTTAGATC TCAGTGACGA ACAGTGCCAA 
GAAGTAACGA TGAAAATCAA GAAACTCGGC GATGTACGTC CCTTGAACAT CGACGATGTG 
GATTCCATCA TCAAAGATTT CCATGCCAAT GTGACCACAC CTGTTGTACG TCCCGTGGGA 
ATCAACAGTG ATACAGCTCC GCGAGTACCA CATAATCTCG AGAGATTGGA TGGGAATGGC 
GTAGTAGCCC GGAAACTATT GGGACGTCGT CGTTGA

Protein sequence

MEMDSVIDGF LKFDLEYTEI TYNNPYGPNP ADYLSNVSHF QVIESTLREG EQFANAFFLT 
DTKIAIAKAL DDFGVDYIEL TSPVASEQSR RDCEAICKLG LKAKILTHIR CHMDDARVAV 
ETGVDGVDVV IGTSQFLREY SHGKDMTHIT QSALEVIEYV KSHGIEIRFS SEDSFRSELT 
DLLSIYRAVD KVGVNRVGIA DTVGCANPRQ VYELVRTLKG VVSCDIECHF HNDTGCAIAN 
AYTALEGGAK LIDVSVLGIG ERNGITPLGG LMARMIAADR DYVLSKYKLH KLRDIETLVA 
ESVRVNIPFN NPVTGFCAFT HKAGVHAKSI LAPPSEYEIL SPSDFGLTRY IHFANRLTGW 
NAIKSRVDQL NLDLSDEQCQ EVTMKIKKLG DVRPLNIDDV DSIIKDFHAN VTTPVVRPVG 
INSDTAPRVP HNLERLDGNG VVARKLLGRR R