Gene PICST_70121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_70121
Symbol	GUA1
ID	4837220
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009042
Strand	-
Start bp	2276282
End bp	2277974
Gene Length	1693 bp
Protein Length	528 aa
Translation table	12
GC content	46%
IMG OID	640388535
Product	GMP synthase
Protein accession	XP_001383192
Protein GI	126133334
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0518] GMP synthase - Glutamine amidotransferase domain [COG0519] GMP synthase, PP-ATPase domain/subunit
TIGRFAM ID	[TIGR00884] GMP synthase (glutamine-hydrolyzing), C-terminal domain or B subunit [TIGR00888] GMP synthase (glutamine-hydrolyzing), N-terminal domain or A subunit

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0970266
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0696406
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

CCCCCTTTAA ACTCTCCTCT AGTACTACCG TAAAACTAGT CTACAATGTC CGCTGCTGAT 
GTTCCTGTTG AAATCACCAA GGTGTTCGAC ACTATCTTGG TGTTAGACTT TGGTTCGCAA 
TACTCCCATT TGATTACTCG TCGTTTGAGA GAATTCAATG TCTACGCTGA AATGTTGCCT 
TGTACCCAGA AGATCTCTGA ATTGTCATGG AAGCCTAAGG GTGTGATTTT GTCTGGTGGT 
CCTTACTCGG TTTACGCCGA GGACGCCCCT CACGTTGACC ACGATGTCTT CAAGTTGGAT 
GTGCCTATCT TGGGTATCTG TTACGGTATG CAAGAAATTG CCTGGATCAA TGGTAAGGGT 
GTTGCCAGAG GCGACAAGAG AGAATACGGT CCAGCCACTT TGAACGTCGA AGACAGCAGT 
AACGCTCTTT TCCATGGTGT AGACCATTCT CAGGTCTGGA TGTCCCACGG TGACAAGTTG 
CACGCCTTGC CTACCGGCTA CAAGATCGTT GCTACCTCCG ACAACTCACC ATATGCCGCT 
ATCTACAACG AAACCGACAA TATCTACGGT ATCCAGTTCC ATCCAGAAGT CACCCACACC 
ATCCAGGGTA AGACTATCTT GAAGAACTTC GCTGTTGACA TCTGTAAGGC TAACACCAAC 
TGGTCTATGG AAAACTTCAT CGACACTGAG ATTGCCAGAA TCAGAAAGTT GGTTGGTCCT 
ACTGCCGAAG TCATCGGTGC TGTTTCCGGA GGTGTGGACT CCACTGTCGG TGCAAAGATC 
TTGAACGAAG CTATTGGCGA CCGTTTCCAT GCCATCTACG TCGACAACGG TGTGATGAGA 
AAGAACGAAA CCGAAACCGT CTACAAGACC TTGACTGAAG GCTTGGGAAT CAACTTGACT 
GTAGTTGATG CTTCTGAATT GTTCTTAGGT AGATTGAAGG GTGTCACCGA TCCTGAAAAG 
AAGAGAAAGA TCATTGGTAA CACCTTCATC CACGTTTTTG AAGAAGAAGC TGCCAAGATC 
ACGCCAAAGT CCGGTCAGGA AATTGAGTTC TTGTTGCAAG GTACTTTGTA CCCAGATGTT 
ATCGAATCTA TCTCGTTCAA GGGTCCTTCT CAAACCATCA AGACTCACCA CAACGTCGGT 
GGTTTGTTGG AAGACATGAA GTTGAAGTTG ATTGAACCTT TGAGAGAATT GTTCAAGGAC 
GAAGTACGTC ACTTAGGTGA GTTGTTGGGT GTTCCAACCG ACTTGGTTTG GAGACATCCT 
TTCCCAGGTC CAGGTTTGGC TATCAGAGTC TTGGGTGAAG TTACAAAGGA ACAGGTTGTC 
ATTGCTCGTG AAGCCGATGC CATCTTCATT GAAGAAATCA AGAAGGCTGG TTTGTATAGA 
GAAATCTCGC AAGCATTTGC TGCCTTGTTG CCTGTCAAGT CTGTCGGTGT CATGGGAGAC 
CAAAGAACCT ATGACCAGGT CATTGCTCTC AGAGCCATCG AAACTGTTGA TTTCATGACT 
GCCGACTGGT ACGTCTTTGA AGCTTCCTTC TTGAAGAGAG TCGCTTCAAG AATCGTCAAC 
GAAGTTGATG GAGTTGCTCG TGTCACCTAC GACATCACCT CTAAGCCTCC AGCTACTGTT 
GAATGGGAAT AGAGAATTTA GAACTAATAG TCTGTACAAT AAAAGAAGTA TATTAAATCA 
TAGCATATAA TTT

Protein sequence

MSAADVPVEI TKVFDTILVL DFGSQYSHLI TRRLREFNVY AEMLPCTQKI SELSWKPKGV 
ILSGGPYSVY AEDAPHVDHD VFKLDVPILG ICYGMQEIAW INGKGVARGD KREYGPATLN 
VEDSSNALFH GVDHSQVWMS HGDKLHALPT GYKIVATSDN SPYAAIYNET DNIYGIQFHP 
EVTHTIQGKT ILKNFAVDIC KANTNWSMEN FIDTEIARIR KLVGPTAEVI GAVSGGVDST 
VGAKILNEAI GDRFHAIYVD NGVMRKNETE TVYKTLTEGL GINLTVVDAS ELFLGRLKGV 
TDPEKKRKII GNTFIHVFEE EAAKITPKSG QEIEFLLQGT LYPDVIESIS FKGPSQTIKT 
HHNVGGLLED MKLKLIEPLR ELFKDEVRHL GELLGVPTDL VWRHPFPGPG LAIRVLGEVT 
KEQVVIAREA DAIFIEEIKK AGLYREISQA FAALLPVKSV GVMGDQRTYD QVIALRAIET 
VDFMTADWYV FEASFLKRVA SRIVNEVDGV ARVTYDITSK PPATVEWE