Gene PICST_28429 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_28429
Symbol	AMB1
ID	4851207
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009068
Strand	+
Start bp	1196174
End bp	1197472
Gene Length	1299 bp
Protein Length	432 aa
Translation table
GC content	45%
IMG OID	640392915
Product	beta alanine synthase
Protein accession	XP_001387458
Protein GI	126274193
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.406154
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0472974
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTTCA AATCGTTAAA ACTTACCCCC GGCAGATTGC TTGCTACCAT TCATGACACG 
GCTGAGAAGT TCGGTGCCAA AGGAGTGTGG GGCCCAGCAT CGACTGAAAC TGGAGTATGT 
CGTCTCACGT TAAGCGATCT TGACAAAGGA GTGAGAGATT GGTTTATCGC GGAAACGAAA 
GGCTTAGGCT GCGAAATCAA GGTCGACCAG ATCGGTAATA TTTTTGCCAT ATACCCAGGG 
AAAAAAGAAA ATGCCAATGC TCTCCCAACA GCCATTGGGT CTCATTTGGA TACCCAGCCT 
ACTGGGGGAA GATACGACGG GATCTACGGA GTGTTGTCTG GGTTGGAAGT GTTGAGAACA 
CTAAAGGACA ACGACTTTGT GCCCAACTAC CCAATTGCGC TTATAGACTG GACCAATGAA 
GAAGGTGCCA GATTCCCCAT GTCGATCATG GCCTCGAGTG TATGGGCTCA AAACATTCCT 
TTGGAACGGG CCTATAAGCT TGAGTCAGTG ACAGATGCCG AGCCTGTAAC TGTAGAACAC 
GAGTTGAAAA GAATCGGCTA TTTGGGTGAA ACTGCAGCCA GTTACCTTGC CAATCCCATT 
AAAGCTCATT TCGAGATTCA TATTGAGCAG GGCCCTATTC TTGAAGACGA GGACAAACTC 
ATTGGTATCG TCACAGGAGT CCAAGCATAT TCTTGGATCA AGGTAAAAGT ATTTGGTAAG 
GCACAACATA CAGGGACTAC ACCTTTGGCA GCTCGTTCTG ATGCCTTGTT AGCAGCTTCC 
AAGATGATTG TCAAAGGTAA CGAATTGGCC AAGAAACATA ACTGTTTATT CTCTGTAGGT 
GTTCTCAATC TTCAACCAGC TGTAGTCAAT GTGATTCCCG AACATGTCGA GTTCATTATC 
GATGTACGTC ATGTGAAGGA TGATGGTTTG AGCGTAATTT TGGAGGAGAT CAAGTCGGAC 
TTTGTTCTGA TTGTTGGTGA TTCTGGAAGG GCTTTGACAG TCGAGTTTGA CCACATTTAC 
ACTTCAGATG CTGTCAAATT CCATGAAGAC TGTATTTCTA GTGTAACCGA ATCAGCGGAA 
GAGATAGTGG GAAAAGAGAA GGCTCGTACT ATCATCAGTG GTGCTGGTCA CGACTCATGT 
GCTACAAGTA CTAGAGTACC TACGTCGATG ATCTTCATTC CTTCGAAAGA CGGAGTCAGT 
CACAACCCTG CCGAATACAG TAAGCCGGAA GAGGTCCACA CTGGATTTGA AGTATTGCTT 
AATGCGGTGC TCAAGTACGA TAGCAAGAGA ACTGATTAA

Protein sequence

MSFKSLKLTP GRLLATIHDT AEKFGAKGVW GPASTETGVC RLTLSDLDKG VRDWFIAETK 
GLGCEIKVDQ IGNIFAIYPG KKENANALPT AIGSHLDTQP TGGRYDGIYG VLSGLEVLRT 
LKDNDFVPNY PIALIDWTNE EGARFPMSIM ASSVWAQNIP LERAYKLESV TDAEPVTVEH 
ELKRIGYLGE TAASYLANPI KAHFEIHIEQ GPILEDEDKL IGIVTGVQAY SWIKVKVFGK 
AQHTGTTPLA ARSDALLAAS KMIVKGNELA KKHNCLFSVG VLNLQPAVVN VIPEHVEFII 
DVRHVKDDGL SVILEEIKSD FVLIVGDSGR ALTVEFDHIY TSDAVKFHED CISSVTESAE 
EIVGKEKART IISGAGHDSC ATSTRVPTSM IFIPSKDGVS HNPAEYSKPE EVHTGFEVLL 
NAVLKYDSKR TD