Gene PHATRDRAFT_40017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_40017
Symbol	TYR1
ID	7195493
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011689
Strand	-
Start bp	605879
End bp	607519
Gene Length	1641 bp
Protein Length	546 aa
Translation table
GC content	52%
IMG OID
Product	tyrosinase
Protein accession	XP_002184029
Protein GI	219127618
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.645981
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGCTCAA TGCTTCTCGT ACTCTTCCTT GAATGCCATT CGACGACTGG TAGGACAATG 
GCTGCAACAA CAAGAAAGGA AAGTGCACAA ACCAACGATA CCGTGCGACC ATTGGGCGCC 
AACGCATTTT GTAAAAACGG GGAAAAGACA AGGATTCGAC GTGACTGGGA CTTGATCTCT 
CGTGACGACC AGGACCTCTA CATCGAGGCG ATCGAAGAAG CAATAGATCG AGAATTATAC 
CAGGCTTTCT TGGGCTACCA TGCGGACTCT GTAGCGTTAG TACAATCGCA CGAAACATGT 
GGTTTCGCAT TGTGGCATCG AACCTTTCTG TTAGCTTTCG AAAACATGTT GCGGTCGCTG 
GCACCACGGT TTGCTTGTCT CACTATCCCT TATTGGAATG TGATGGAGCA TTCTAGTGAT 
CAAGCCAGAG GCTTGTGCAC CAGCTATCGA ACCTGCTCCA GAATAGTAGG AGACCTTGGT 
GGTAGTCCTG TCGCGGCAGC AGCGACCCGT CTGTATGCCG GCATTGAGGC TACTGGAGAT 
TTGATTACCG GTCGTCCAAT TCGCAATCTC CATGATGACA ACAACGCTAC TGGCATAGTG 
CGCGATGACT TATTCTGGGT CACTCTGCCT GCGAGTACAG CGTACGATAG CGTTCTCGAT 
ATCCTGGTTA CTAGTCCGTC CTACGTTCAA TACACACGTC GGATCCAGGA AACCATTCAC 
GACGATGTTC ACGACACGTT GGGTGGCTTC ATGCCCACAT ACTCAAGCCC CACTGATCCA 
CTCTTTATGC CGTGGCACAG CTTTATCGAT CTTGCTTTGT TCATGTGGGA AGCTTGCTAC 
TTGGATCCAT CGGAACAAGC TTCCGGTACG CGTCTTGCTG CAGACTGGGC GTTTGAGGGC 
GCCGGATCGA ACTGCTCCCG AAGTGGTCGC AGTAAGGTCC TGTTCCCCAT CCTCAACGCC 
ACGAGCGAGC TATATCTTAT GAGGGGTGAC TTTCATGTGC TTGAAGATCC CTTGATTGGA 
ATCTATTTTG CCGATATTGG AATTCTTTTC TCGGATGTGG CGTCTATTCG TGACTTGGGA 
GAGGACTTTG ATTTCACCTA CGATCACGTG ACGGAGCGGA TTTGGAATGT CCTGCAAGAT 
CCGTCTCAAT GTCCGTCCTC GGGATCCTGG ACAGCCTTTC CGACTCCGTC GCCGACAACG 
GCATCCCCCG TGGTAGGATC ACCAAACGAT GCCGATGCTC GTAGCGAATG GCTGGCTGGG 
ATCCGTCAGC GCCTCGAGGA AATGTTTGCC GAAACACACC CGGGATACGT TGCCCAATAC 
ATGTCTTACT TCACCTGTGT CACGCAGGAT GAGACAAGTC TCTCTGTATA CACAGAGGAT 
CCGGGCGAGT ACTTGGTTGA TGTGTTGAAT GGCAACGCGA TTATTAGAGC GCGTTGCGCC 
TTTTTCCTTC CCGAAACAGA GTCCGTTACG AATGAGGAAT TGCCCACGTC TTCGACTCCT 
GTGGCTGCGC CCTCTGAGAA CAGGGACCAG TTTGCAGGCG ACGACGAGGA TGATGACCAG 
ACTAGTACCG CCCTAAGAGC ACCTCAACCG TACTTTGGCA TTGGGTTGGT CAGCTGCTTG 
GTGCTACTCG TTGTGGACTA G

Protein sequence

MCSMLLVLFL ECHSTTGRTM AATTRKESAQ TNDTVRPLGA NAFCKNGEKT RIRRDWDLIS 
RDDQDLYIEA IEEAIDRELY QAFLGYHADS VALVQSHETC GFALWHRTFL LAFENMLRSL 
APRFACLTIP YWNVMEHSSD QARGLCTSYR TCSRIVGDLG GSPVAAAATR LYAGIEATGD 
LITGRPIRNL HDDNNATGIV RDDLFWVTLP ASTAYDSVLD ILVTSPSYVQ YTRRIQETIH 
DDVHDTLGGF MPTYSSPTDP LFMPWHSFID LALFMWEACY LDPSEQASGT RLAADWAFEG 
AGSNCSRSGR SKVLFPILNA TSELYLMRGD FHVLEDPLIG IYFADIGILF SDVASIRDLG 
EDFDFTYDHV TERIWNVLQD PSQCPSSGSW TAFPTPSPTT ASPVVGSPND ADARSEWLAG 
IRQRLEEMFA ETHPGYVAQY MSYFTCVTQD ETSLSVYTED PGEYLVDVLN GNAIIRARCA 
FFLPETESVT NEELPTSSTP VAAPSENRDQ FAGDDEDDDQ TSTALRAPQP YFGIGLVSCL 
VLLVVD