Gene PICST_33820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_33820
Symbol	QDR22
ID	4840912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009048
Strand	+
Start bp	558697
End bp	560127
Gene Length	1431 bp
Protein Length	476 aa
Translation table	12
GC content	43%
IMG OID	640392227
Product	multidrug resistance transporter
Protein accession	XP_001386502
Protein GI	126139960
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0731367
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTTTGA TCCTTATCTT GTCGTTGGTC GGCTTTTGGA GTACAGCATC TTCGCCCATA 
TACTTTCCAG CCTTGCCTAC TCTAACTGCG TATTTCCATA CTACACCTTC AGTCATGAAC 
TTGTCAGTTG TGGCTTACTT GGTTTTCCAA GGGATTGCAC CCACAGTTTC TTCAAACTTG 
GCCGATAACT TTGGGAGAAG ACCGGTGATC TTGGCTTGCA TCTTGATCTT CATCGCTGCC 
TGTATTGCCA TTTCTAGAAC AAATGTCTAT TGGCTCTTGG CAGTGTTGAG ATGTGTACAA 
GCAGCAGGCA TAGGTCCAGT TATTGCCATC AGCTCAGGAG TAGCTGGTGA TGTGTGTACT 
AGTGCCGATA GAGGAGGATT CGTCGGTATC GTAGCTGGAA TACAATTGCT TGGAAATGGT 
ATGGGTGGAA TGGTAGGAGC AGCTCTTATA AACCAATTCA ACAGTTGGAG AGCCATCTTT 
ATTTTCTTAG CTATTGGAGC AGGAGCTACT CTAATCTTTT CATTTTTCTT TCTTCCAGAA 
ACGTCAAGAA GAATAGTAGG AAACGGTTCT ATTGTTCCCA AACACTTTAT CTCGAAGTCA 
GCGCTCATCT ACTTACCCCA TTTCAAGAAA AGAATAAATA ATGATACGAC TACTCTTGAA 
CCTCCTACGT CTTTCGACTT CCTTAGTCCC TTCAAGATCT TTTTCAAAAA GACGGTTTTT 
CTTACTTTAC TTCCTGGAGG ATTACACTTC GCAGCATGGA CAGTAACTTT GACTTGCATT 
TCTACTTACT TAGAACAGGA ACCTTACAAT TACACCGTCT TGCAAGTTGG TTTTGTATAC 
CTACCACAAG GTTTATCCTG TCTTGTGGCT TCTATTTTAA TTGGACGAAC ATTGAACTGG 
TACTATCGCT ACAGTTTGAA GAAATACAAC GACAAGTACC AGGATGCATT ATTGAAGCCT 
CGATTCAACA TTTTCCGTGC CAGAATGACC GTGTGTATTG TTCCGGCCGT TCTCATGATT 
ATAGGGCTTG TAATCTTTGG TTGGTGTCTA CATTATCATC AGCATATTGC CTCTATAATT 
GTATCCTCCA TTCTTATTGC AATGTCGTCG TCGTCCTTTA TTGCTGCGAT GACAACAATG 
CTTGTCGACA TGCATCCCAA CAATGGCAGT GCCTCAACAA GTTGTTTGAA TCTCATGCGT 
TGCTTGCAAG CAGCATTATT TTCAGGTGTT CTCGAAAACA TGATAGCTTC CATGGGATTG 
GGAGGCACTT TCACTCTTTT GGCTGGCCTT TGCATTGTGC TTGACCTTTG TTTGGTCTAC 
GTTGTCATTT CTGTCTCCAA GAACCTCAGA GAAACTTCTG CGCTCACTAC ACCAGTTGAA 
TCTGACAACG AAGTGGACGA GGTACCGGAG CAGAAGTCAC TTCAGCCATA G

Protein sequence

MVLILILSLV GFWSTASSPI YFPALPTLTA YFHTTPSVMN LSVVAYLVFQ GIAPTVSSNL 
ADNFGRRPVI LACILIFIAA CIAISRTNVY WLLAVLRCVQ AAGIGPVIAI SSGVAGDVCT 
SADRGGFVGI VAGIQLLGNG MGGMVGAALI NQFNSWRAIF IFLAIGAGAT LIFSFFFLPE 
TSRRIVGNGS IVPKHFISKS ALIYLPHFKK RINNDTTTLE PPTSFDFLSP FKIFFKKTVF 
LTLLPGGLHF AAWTVTLTCI STYLEQEPYN YTVLQVGFVY LPQGLSCLVA SILIGRTLNW 
YYRYSLKKYN DKYQDALLKP RFNIFRARMT VCIVPAVLMI IGLVIFGWCL HYHQHIASII 
VSSILIAMSS SSFIAAMTTM LVDMHPNNGS ASTSCLNLMR CLQAALFSGV LENMIASMGL 
GGTFTLLAGL CIVLDLCLVY VVISVSKNLR ETSALTTPVE SDNEVDEVPE QKSLQP