Gene PICST_82575 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_82575
Symbol	AQY1
ID	4838270
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009043
Strand	-
Start bp	193001
End bp	194013
Gene Length	1013 bp
Protein Length	267 aa
Translation table	12
GC content	45%
IMG OID	640389585
Product	aquaporin
Protein accession	XP_001383665
Protein GI	126134281
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0580] Glycerol uptake facilitator and related permeases (Major Intrinsic Protein Family)
TIGRFAM ID	[TIGR00861] MIP family channel proteins

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.340504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.546499
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACTG AAAACGAAAC CTTTGACCAA GAGGCCCAAC AGACCTACAA CCCAAAGTTG 
GACGCCACTA TCACTGCTTC TCCATTGAAG AACCATTTGA TTGCATTCCT TGGTGAATTC 
TTCGGTACCT TCATCTTCTT GTGGACTGCT TTTATGATCG CCCAAATTGC CAACCAAGAC 
CCTAACATTC CTGAAGTTGG ATCTGAACCT CAACAATTGA TCATGATCTC TTTCGGTTTC 
GGTTTTGGTG TCATGATGGC TGTATTCATG TTCTACAGAA TTTCTGGTGG TAACTTGAAC 
CCAGCTGTCA CCTTAACATT GGTATTGGCC CAAGCTGTTC CTCCTGTGAG AGGTGCCATC 
ATGATGATTG CTCAAATGAT CGCTGGTATG GCCGCTGCCG GTGCTGCTTC TGCTATGACC 
CCAGGCCCAA TTGCCTTTGC TAACGCTCTT GGTGGTGGAT GCTCCAGATC CAGAGGTGTA 
TTCATTGAAG CCTTCGGTAC TGCTATCTTG TGTTTGACTG TCTTGCTCTT GGCCGTTGAA 
AAGCACAAGG CTACATTCAT GGCTCCATTT GTCATTGGTG TTGCTCTTTT CTTGGGTCAC 
TTGATCTGTG TCTTCTACAC CGGTGCTGGT TTGAACCCTG CTAGATCTTT CGGTCCAGCT 
GTTGCCTCTA AGTCCTTCCC AGACTACCAC TGGATTTACT GGGTTGGCCC AATCTTGGGT 
TCCGTCATTG CCTTTGCTAT CTGGAAGATC TTGAAGGTTT TGAACTACGA AACCTGTAAC 
CCTGGCCAAG ACGCTGACCA CTAATCGCCC GGAATTAATT GTGGTGCATT GTCATTGCAA 
TTGTCCGGAA TTTAAACCGA GCCGATTGTA TGCACCTACG ATGAAACAGC ATTGGTTTTT 
ATATGTATCC AATGTCAAAA AATCGAGAGC ATGTTCATTT CACGATTACC TTTAGATAGC 
TCCACACCTA ATTTTATCCA TAGTGGCTAC TAATTACTAA TAATACTTAA TTT

Protein sequence

MTTENETFDQ EAQQTYNPKL DATITASPLK NHLIAFLGEF FGTFIFLWTA FMIAQIANQD 
PNIPEVGSEP QQLIMISFGF GFGVMMAVFM FYRISGGNLN PAVTLTLVLA QAVPPVRGAI 
MMIAQMIAGM AAAGAASAMT PGPIAFANAL GGGCSRSRGV FIEAFGTAIL CLTVLLLAVE 
KHKATFMAPF VIGVALFLGH LICVFYTGAG LNPARSFGPA VASKSFPDYH WIYWVGPILG 
SVIAFAIWKI LKVLNYETCN PGQDADH