Gene PICST_61009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PICST_61009
Symbol	MID1
ID	4839272
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Scheffersomyces stipitis CBS 6054
Kingdom	Eukaryota
Replicon accession	NC_009045
Strand	-
Start bp	761697
End bp	763334
Gene Length	1638 bp
Protein Length	532 aa
Translation table	12
GC content	43%
IMG OID	640390587
Product	integral plasma membrane protein
Protein accession	XP_001385156
Protein GI	150865796
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0502869
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0930816
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAATC TTGTGGTGGC ATTCGTGCTG TTCTTTCTCG CCACTGGCGC GGTGGCCATA 
AACTTCGAAT TCGATATCGA CGCTGGACTT GCACTCCCTG TTGAGAATCC ATACGAAGAA 
ATTGCACAAG AATATGAAAT GAACCAAATA GAATTCGGAA GCAGCCTCAA CAAAAAGCCA 
AGTATAGATG GCAATGTCAG TAAACGATTT GACATAGGAG CCGTTAAGGT GTCCAACGTC 
AATTCCCACG GACTTCATGA GTTTACACCT ATTAGCGATA CTATTGTCCA GAGTGATACA 
AAGTACTACT CTTTCAGTGT GAACACCACC TCTGGGTTAG GAGAGTTCTA CGAATTGTTG 
ATCTTTATCA CGGGTAATAT TTGTACGCAG CCATCAAACG TAGGAGCCAA CCAGACCAGT 
TTAGCTGTGT ATTATTCATT TAATTCGTCT ATATTCACTA ATATAGAATA CTCAACTATG 
GTGTTATTTG AAAATGGCTA TGTCCAGTCA TTGGCCGATG TGGCTGTGAA CTCTAACAAT 
AACGAGTCGG TGCTATATAT TGTAGTGCGG GCGCCTGAAA ACGTCAACAA AACGGCTACA 
TGGACATATC AGATCGGAGT TTCCCAGAAC GATTTAGTAT TCCAGTGGGA TGATCAGACC 
TGGGCACAAT TCATAGATTC AGACGATGAT TCGGCTCTTG TAGTTACCGG TAATTTGACC 
AATGTTCAGG GACTTAACAT CACGGAGTTG AATGCAACAA GATCGCAGTT TTCGTTGTAT 
GTCTATTCAA ATGACTATAG ACACTATTTC GATACCCTCA ACAGCAGTTG GTGTGCAGTT 
AGAAACGGCC CAGCTCTTAT GAATCCTGCT ACTATAGAAA GTAGCTATAC CAGCAGACAG 
GGCTCGCTTC ACCAGCAATT CCATCTCACG GGACTTAACA AATCGACGAA ATACATAGCG 
TACTTGATCT CCGACTTCCA CGGAAGCGAC TTTGGAGGAG CGGTGTATCG TCCCTTTGAG 
TTTGAAACGT TGGACACTGA AGCCTGTGAA CTAATCTATA ACTTAGAATT TTGCAACCAG 
ATTGCCTATT CGGTACCGGC TACACCAGGT GGTTCTAAGG AAGAAGTTCG ATCTCTCTAC 
GATAATCAAG CAAGAAACCT CTTCACCAAC TTCAGTAAGG CTATCCAGCA AATTCTGTGT 
GATACTGAGG ATACGGCCCA ATTCTCTCCT ATTAAAACCT GCAGTGATTG TATATCTTCA 
TATAAGGACT GGCTCTGTGC TATCACCATT CCTCGATGTT CAACCAGAAA CATAACCGGA 
TACACCGAAA GAAAGCCAGG TGAATCTCGT AATAGTTTTA TCAATGACAT TGTTATGCCC 
AACTTGTCTT ACTACGAAGT TATGCCCTGT GTCAATATCT GTGAAGCTAT AGTGAGAGAC 
TGTCCGGCTC AGTTTGGATT CATGTGTCCC ACCACCAACG AAACTATACG ACAATCGTAC 
TACTGGGATA ACGGGGGACA ATGGCCTACT TGTAACTATG TCGGCAAGTT GACCGTCGTG 
ACTAATGCTG CCTTCAGGGC ATCCATGGTT AATTGGTTTA TGTTGGTTCT CCTGGTAGCT 
TTAACAGTAT TGGTGTAG

Protein sequence

MNNLVVAFVS FFLATGAVAI NFEFDIDAGL ALPVENPYEE IAQEYEMNQI EFGSSLNKKP 
TVKVSNVNSH GLHEFTPISD TIVQSDTKYY SFSVNTTSGL GEFYELLIFI TGNICTQPSN 
VGANQTSLAV YYSFNSSIFT NIEYSTMVLF ENGYVQSLAD VAVNSNNNES VLYIVVRAPE 
NVNKTATWTY QIGVSQNDLV FQWDDQTWAQ FIDSDDDSAL VVTGNLTNVQ GLNITELNAT 
RSQFSLYVYS NDYRHYFDTL NSSWCAVRNG PALMNPATIE SSYTSRQGSL HQQFHLTGLN 
KSTKYIAYLI SDFHGSDFGG AVYRPFEFET LDTEACELIY NLEFCNQIAY SVPATPGGSK 
EEVRSLYDNQ ARNLFTNFSK AIQQISCDTE DTAQFSPIKT CSDCISSYKD WLCAITIPRC 
STRNITGYTE RKPGESRNSF INDIVMPNLS YYEVMPCVNI CEAIVRDCPA QFGFMCPTTN 
ETIRQSYYWD NGGQWPTCNY VGKLTVVTNA AFRASMVNWF MLVLSVALTV LV