Gene PHATR_33082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATR_33082
Symbol
ID	7204080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011671
Strand	-
Start bp	3397
End bp	4950
Gene Length	1554 bp
Protein Length	517 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002186257
Protein GI	219113347
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTGTC AAAAACTCAA GGGTGTCACC GAACTTCGCA AGGGATGCTC TTCGGAGTCA 
TCGCTCAAGG CGGCATCTCG GCACTTCGAT CTCTTCCTTG AAGAGGTGAT TTCGTCCGGC 
ACCATTGGCG GAAAAGAGAA GCAGCAGCTC TTTCCAATAA GAAGCATCAA TAACAGCACA 
GATAGCAACA ACATTGATAA CAGCGAAAGA TTGGATGGTG ATGCGCAGAC GCAGTACTCG 
TTCAAAACCA TCGCCGCGGA AAAGATCAAC GACAAACTGC TGAATCTCTT TGCTGGATAT 
TTGACAAGGG CTGAAAAACT CCGTGGGAAT AAGAACGAAA CGCAGGACAA TTTCTCGGAT 
GGCAACGGAA TTTCGTACAA CACGGCAGAA CGATACCTGA GCTCCATTAA GAACGAGATT 
CTTCGTCGTT GCCTTGATTT GGGGCTAAAG AGATCTTTCG ACGATGCGCA ACAAACGCGA 
ATTCGCCAGT CCATGACAAG ACGTTTTGTT GAAAGAGCCG TCCGGAACAA GACGCCTCTG 
GCCAGATCTC ATGTCACAGC TGCTCGGAAC GACTTTCTTG TAATTGCGTT TTTATGTATC 
TGGGACGGTT CTTTTCCGAT GGCGGATATG TTATTTTATC TTTTGACGCT CCGATACTTA 
GCCGGCCGGG GCCAGGAAGT GGCCATGATA TCACGGTCTA GAGTTTCTCT TGGTGAGCCA 
TCAGAATGGG CCGATAGTGG TGACAAGACC TTTGTTGTGA GGCTGTGGAG GTCGAAAGTC 
AGCCACGAGC AGGATCTTTC TATTGTTCCT CACCAAAGTG AAATGTTGCT TGATTGGGTG 
TTTGCATTTG CCTATAGTGC TGTGATGAAT ACCAACCCAA ACGACTCGTT GTTCCCGACC 
TTTGCCGAAA AAGTGGAGTT GCGCAATTTA TCAGCTGGAA ACATCAATGA TGAAGAAATT 
GGAAATGAGA CTACCCAAGA TAGTACTTTG AAAGCAAAGG TAGATTCCAG CAAAAAAGTC 
ACCAAGTACT TTCAAGCACT TTTGGAGCGA CTAATTAAGA CAAGCGAGGA GCTTGTAGGT 
CCGAACGAAA TGGCTAGAGC TGCCGGTTTG TATCAGGATG ATGAAGATTT TAGCGAGGAA 
TTTGATGGTA GCAGCTGCGT CGGTACAACT AGTGTCAACA ATGAGCCAGG AATATTCAAT 
CTGACAGGAG AAGAAGAAAC GGTTGGATTG GATCCCCCAG CCAATGCTGC CTATTACTAT 
AGCGGTTTGC TTCATAAGCA CGGCATTTCA GCCGGACTCT CAACACATTC GGCTAAGCGC 
TCTGCAGTCG AAATGGCAAA TGAAAGTGCT CTATTGCTCA CAACATGGGT ATGCTTCCGG 
GCAGGATGGC TGATGAAAGC AGTGCATACT ATTTTTGATT ACCTATCATT TAATCCGAAA 
AATGATCGAC AAGTTTCGAG GGTGTTCAGC GAATGGAATA CGCCATCTTT TCGTGGTGAG 
ATACTAGGTG GGCGTCCTCC AAGACTCCAT CCCATTCGAC TTCAGGGATC CTAA

Protein sequence

MNCQKLKGVT ELRKGCSSES SLKAASRHFD LFLEEVISSG TIGGKEKQQL FPIRSINNST 
DSNNIDNSER LDGDAQTQYS FKTIAAEKIN DKLLNLFAGY LTRAEKLRGN KNETQDNFSD 
GNGISYNTAE RYLSSIKNEI LRRCLDLGLK RSFDDAQQTR IRQSMTRRFV ERAVRNKTPL 
ARSHVTAARN DFLVIAFLCI WDGSFPMADM LFYLLTLRYL AGRGQEVAMI SRSRVSLGEP 
SEWADSGDKT FVVRLWRSKV SHEQDLSIVP HQSEMLLDWV FAFAYSAVMN TNPNDSLFPT 
FAEKVELRNL SAGNINDEEI GNETTQDSTL KAKVDSSKKV TKYFQALLER LIKTSEELVG 
PNEMARAAGL YQDDEDFSEE FDGSSCVGTT SVNNEPGIFN LTGEEETVGL DPPANAAYYY 
SGLLHKHGIS AGLSTHSAKR SAVEMANESA LLLTTWVCFR AGWLMKAVHT IFDYLSFNPK 
NDRQVSRVFS EWNTPSFRGE ILGGRPPRLH PIRLQGS