Gene PICST_90976 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_90976
Symbol	KAP1
ID	4840662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009047
Strand	-
Start bp	852416
End bp	853486
Gene Length	1071 bp
Protein Length	199 aa
Translation table	12
GC content	42%
IMG OID	640391977
Product	Adenylyl-sulfate kinase (APS kinase) (Adenosine-5'phosphosulfate kinase) (ATP adenosine-5'-phosphosulfate 3'-phosphotransferase)
Protein accession	XP_001386353
Protein GI	126139661
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0529] Adenylylsulfate kinase and related kinases
TIGRFAM ID	[TIGR00455] adenylylsulfate kinase (apsK)

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.342518
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CTACATTTTT CTTAGCATTT TGTTCCACAT TATCAAAATC ATAGCCTTTT CTCGGTACCA 
GCCACAACTA CTCCAAGCCG TGTATTCGGA TTTGCAAACG CTTTACGACT CTCATTTGCG 
AGTCTCTTGT TCACATCGAA AGCCTGTCTT TCTCTCACTT CATGCTTATA ACCTTCACTG 
TAGCTTTTGT AAGTTCGGCT CTTCTCAGTT CAACTTCTTA CATCAATTTT CTGCACCATA 
CGCAGAAGTG CTGCAACGCT CTTATCTTCA CGTGAACTGT TCCCCATATC ACGTGGTATG 
GTGAACCACA CAAATTTTTC AACCATATAG AGCTTGACAA TTGCAAATTA CCATCAATTT 
TGACTATGAG TCAGGTCTTC TTTCTACTCG TTTTATTGAC TCAAAATCCC AAAAATGGCC 
TCCAACATCA CATGGCATCC AAACTTGACC CACGCTGAGC GTGCCAGCTT GAGAAAGCAA 
AAGGGAGTCA CTGTTTGGTT AACTGGCTTA TCAGCTAGTG GAAAATCCAC TATTGCCTGC 
GCCTTGGAAC AGTCCATTCT TGCCAGAGGC TTGAATGCCT ACAGATTAGA CGGTGACAAC 
GTGAGGTTCG GCTTGAACAA GGACTTGGGC TTCAGCGAAG CTGACAGAAA CGAAAACATC 
AGAAGAATCT CAGAAGTAGC TAAATTGTTC ACAGACTCTT GTTGTGTTAC TTTGACCAGT 
TTCATCTCTC CTTACAAACA AGATAGAGAC TTGGCAAGGC AATTGCACGA AAAGGACAAC 
TTGCCATTTG TCGAAGTCTA TGTTGATGTT CCAGTTGAAG TTGCTGAGCA AAGAGACCCA 
AAGGGGTTGT ACAAGAAAGC TAGAGAAGGT ATTATCAAGG AATTCACCGG TATTTCTGCT 
CCATACGAAG CACCAGAAAA GCCTGAAATC CACTTGAAGA ACTATGAAGG TGTTTCGATC 
GAAGAATCGG CGGAAAAGAT CATCGATTAT TTGATCGAAA ACAAGTATAT TTAAGATAGA 
ACCATACATA GACGTATATA GCGAGAAGTA CATGGACTTC GTTAAAGTGG T

Protein sequence

MASNITWHPN LTHAERASLR KQKGVTVWLT GLSASGKSTI ACALEQSILA RGLNAYRLDG 
DNVRFGLNKD LGFSEADRNE NIRRISEVAK LFTDSCCVTL TSFISPYKQD RDLARQLHEK 
DNLPFVEVYV DVPVEVAEQR DPKGLYKKAR EGIIKEFTGI SAPYEAPEKP EIHLKNYEGV 
SIEESAEKII DYLIENKYI