Gene PICST_47423 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_47423
Symbol	MET22
ID	4839154
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	+
Start bp	183945
End bp	185042
Gene Length	1098 bp
Protein Length	365 aa
Translation table	12
GC content	44%
IMG OID	640390469
Product	3'(2')5'-bisphosphate nucleotidase
Protein accession	XP_001384691
Protein GI	126136335
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1218] 3'-Phosphoadenosine 5'-phosphosulfate (PAPS) 3'-phosphatase
TIGRFAM ID	[TIGR01330] 3'(2'),5'-bisphosphate nucleotidase, HAL2 family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCGA TTTCTGCCCA GCACCCTTAT TACAAGGAAT TGGAGATTGC TACATTGGCA 
GTCAAGCGTG CCTCGTTGCT CACTAAGAAA TTGAGCGATT CTATAGGCGT TACACAGAAA 
TCTGGAACCC AGACAAAGGA CGATAAATCG CCTGTAACTG TAGGAGATTA TGCAGCTCAG 
GCTATTATCA ACTATGCTAT CCAAAAAAAC TTTCCTGGTG ACGAAATTGT CGGAGAGGAA 
GACTCAGACA CTTTGAGAGA AGACACAGAT GAATCTCGGA AGTTGTCGGG TCGCATTCTC 
GAGATCATCG AAGATGTCCA GGACAATACT TCTACCTATA GTGACAAGAT TGGCACACTT 
GAGAACTTGC AAGATATTTA TGAGAGCATA GACCTCGGTA TTTCCCAAGG TGGAGATAAA 
GGTAGAATTT GGGCCCTTGA TCCAATTGAC GGCACCAAAG GATTCCTTAG AGGCGACCAG 
TTTGCAGTGT GTTTAGCTCT TATTGTAGAT GGTGAGGTAG TATTGGGCGT TATTGGCTGT 
CCCAACTTGC CTGAGATTAT CCTTTCCAAC GAAGATATGA CGGGTACTGT TGGAGGTTTG 
TACTCGGCCG TAAAGGGCGT TGGTTCGTTT TATACAGCCT TGTTTGACTC TGACAAGTTT 
GTTCCTTTGT CGAAGCAAGA GAGAATCAAA ATGACCACTA ACACTTCGCC AGCCAGTATT 
AAAGTAGTGG AAGGTGTAGA AAAGGGCCAT TCTTCTCATT CAACGCAGTC AAAGATCAAA 
GACATCTTGG GTTTCAACCG TGAAATCGTT CATAGACAGA CCATAAACTT GGATTCCCAA 
GTCAAATATT GTGTATTGGC TAAAGGACAG GCTGACATCT ACTTGCGTTT ACCAGTCAGT 
GATACCTATC GTGAAAAGAT CTGGGACCAT GCTGCTGGTA ACATCTTGGT GTATGAAAGT 
GGTGGTCAAG TCGGTGATAT CAGCGGTGCC CCTCTTGACT TTGGTAAGGG CAGATTCTTG 
CAATCCAAGG GTGTCATTGC TGGTAATACC CACATCTTCC CTGCTGTTAT CAAAGCAGTA 
GAACAAGCCT TGAATTAA

Protein sequence

MSSISAQHPY YKELEIATLA VKRASLLTKK LSDSIGVTQK SGTQTKDDKS PVTVGDYAAQ 
AIINYAIQKN FPGDEIVGEE DSDTLREDTD ESRKLSGRIL EIIEDVQDNT STYSDKIGTL 
ENLQDIYESI DLGISQGGDK GRIWALDPID GTKGFLRGDQ FAVCLALIVD GEVVLGVIGC 
PNLPEIILSN EDMTGTVGGL YSAVKGVGSF YTALFDSDKF VPLSKQERIK MTTNTSPASI 
KVVEGVEKGH SSHSTQSKIK DILGFNREIV HRQTINLDSQ VKYCVLAKGQ ADIYLRLPVS 
DTYREKIWDH AAGNILVYES GGQVGDISGA PLDFGKGRFL QSKGVIAGNT HIFPAVIKAV 
EQALN