Gene PICST_32526 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_32526
Symbol	NAG5
ID	4840116
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009046
Strand	-
Start bp	16507
End bp	18159
Gene Length	1653 bp
Protein Length	550 aa
Translation table	12
GC content	41%
IMG OID	640391431
Product	hexokinase I
Protein accession	XP_001385689
Protein GI	150866184
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG5026] Hexokinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTATGA TCCACAACTC TTCCAAAGTC GCATCACCAA CAGAAGAAAG CATAATACTT 
CCTATGAAGG GCCTTCATGG AGATGTCACT ATAAGTCCAA CACCCATTCT CATAAACCAG 
AGCGAGGAAA GTGACTTCAT AGACGAGTTG CTGTCTTCTA CTTCTACTTC CAGCGAACCT 
TCGCCCAACT CATCCATTTC CACTGATAGC TCGTGTCTTT TATCTTCCGT AGTAAACGAT 
TTTGTTTATG ATCTCACCAG TCAGAACTTC CTCGAACAGA CGGAGTTTCT TGTCGCCGAC 
TTGAATGAGT CGTTATCTAG AAACTCCAAG ATAACCATGT TGCCCAACTA CAATATTTCT 
CCAACAGGAC AGGAGTCAGG TGAGTTTTTG GTCATTGACT TGGGAGGCTC CACCTTGAGA 
ATCGCTGTTA TCAAGATAGA CCAAGCGTCG GATTCAGACG ACGAAGACAG ATCAAAAAGA 
ATACACATCT TGATGGAGAA GAACTGGACT ATCGATAACA GCTTCAAGAC TCTCGATCTT 
AACTTCTTCA AGTTCATAGG CTCCAAGATC CACGAGATAT TGTGCCATCA GGATTTGATT 
GATATCCGCA ACAATATAAA GACTGGGATC ACCTGGTCGT TCCCTTTGAA GACCACATCG 
TACAATAACG GTAAGATCGT CCATGTCTCT AAGGGCTACA CCATTCATCC AGAAATCTAC 
AACCAGGACT TGAAGTCCAT TTTAGAATCA GTTTTACTAA ACGAGTTTGA TTTACACATT 
GACGTCAAAA GCATTTTGAA CGATTCCTTG GCCGTGTACT CGGCAGGTGC CTTCATTGAT 
AAGTATACCA AGTTGGCACT TGTTTTGGGA ACGGGATTCA ACATGTGCTG CTCATTATCT 
ACATCGGACA AGATGCATTC TGACAAGACG TTGGAAAGCT GCGACAAGAT CTTATTCAAC 
ACTGAACTCA GTTTGTTTGG TGAACATTTG ATTAAGAGCA TAGCTACCAA ATATGATTCG 
TTGATTGACG AGAGATTCAA AACCTTTGAC TTTCATTTCA AGCCATTCAT GTCAACTGAT 
CCTAATACCC ATTCCATTTT CCAACCTAAC GAGTTGATGA CAAGTGGTAG ATACTTGCCA 
GAGTTGACTC GTTTGGTGTT GGTAGATTTA GTTGAAGCTA AAGAAATCTT TGTCAACATA 
AGCCAAAAGG AGGAACTTTT ATCTTCGGCC TATGATGGCT TCAGTGGTGA GTTGATGTGC 
TTCATCAACG AATCGACAAA CGTTGACGCC ATTACCGAAA AATTGTGTGC TCAATATGGT 
TGGTCTGCTT CTGAAGTCAC CATCGGAGAT GTTTTGACGT TGAAGAAGAT TGTTCAAAGT 
ATTGTTGAAA GAGCAGCCTT CATTGTTTCC GTCTCGATTG TGTCCTTCAT TAAGTTGCTC 
CAACAGCACA ATGATGATCA CTTTGACTCA TCCATCATCA ACATTGGATA TGTTGGCTCA 
GTGTTGAAGC ATTTCAATGT CTACAGAGAC TTGGTTAAAC AATATGTTAA CGATAATGAC 
GATATTAAAA GGTTAGGAGT CCAGGTTGAT TTTAAGTTGA TTGAGAATAG TTCAATCATT 
GGTGCTGCTA TCGGTGCAGC ATACTATTCA TAA

Protein sequence

MAMIHNSSKV ASPTEESIIL PMKGLHGDVT ISPTPILINQ SEESDFIDEL SSSTSTSSEP 
SPNSSISTDS SCLLSSVVND FVYDLTSQNF LEQTEFLVAD LNESLSRNSK ITMLPNYNIS 
PTGQESGEFL VIDLGGSTLR IAVIKIDQAS DSDDEDRSKR IHILMEKNWT IDNSFKTLDL 
NFFKFIGSKI HEILCHQDLI DIRNNIKTGI TWSFPLKTTS YNNGKIVHVS KGYTIHPEIY 
NQDLKSILES VLLNEFDLHI DVKSILNDSL AVYSAGAFID KYTKLALVLG TGFNMCCSLS 
TSDKMHSDKT LESCDKILFN TELSLFGEHL IKSIATKYDS LIDERFKTFD FHFKPFMSTD 
PNTHSIFQPN ELMTSGRYLP ELTRLVLVDL VEAKEIFVNI SQKEELLSSA YDGFSGELMC 
FINESTNVDA ITEKLCAQYG WSASEVTIGD VLTLKKIVQS IVERAAFIVS VSIVSFIKLL 
QQHNDDHFDS SIINIGYVGS VLKHFNVYRD LVKQYVNDND DIKRLGVQVD FKLIENSSII 
GAAIGAAYYS