Gene PHATRDRAFT_33955 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_33955
Symbol
ID	7197770
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011672
Strand	+
Start bp	742584
End bp	744050
Gene Length	1467 bp
Protein Length	488 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002178294
Protein GI	219114997
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAGGC GGATAATTTT TGTCGTCCTG TGGTGGTCAC AACAGTCGTT TGATGTTTCG 
GCTATCGAAG ACTTTTTTCG GATCCAAAGT CGGCGCCCTC GCACCCTTTT GGCAGCTCAA 
ACGAATATTG CTGCCTCAAT AGCTGGACTT CGGGGAGGCA ACAACGAGAT TCCCAACGTA 
GAATACGATG AGATTACGGC AATCAAAAAA TCTCGCGAGC AGTCCGCCGA AACCAAGGCA 
ACATCAATCA ATATCCCAGA TGCCATTGCC CGGGATCCTG CTACAGAGTC CCCGCAACCG 
ACATCCAGTG ACGAAGCTAG TGGAAAGGCA GCCGTCTCGA AGCAAACGAC ATCAAACAAA 
TCAACAACAT TTGTTCCCAA GAGACACACG CTTCCCTCGT TACCCTCTTA TTGGAAACGA 
CACGGAAAGA TTTGGAAGGA TCAAGTTGCG TCGATGCAAC TTAGCGCCAA GCCACTTCAG 
CTTTCCATGC AACAAAGCTG GCAGGTTGCC GAACGCCACT CTACCCAGTT CGTATCCACC 
ATGGCAGCTT CCATTATTGC AGTTTTTATA AAAAAGCAGT GCGATATATC GTTCGGCCGT 
CTCTACGCGC TTGCCCTACT CGGCTCATCG GTGGGCTTCT ATCTCTTTCT CTATTTTATT 
TCGGTGGGGT ACGCCTTGGG AGTCGCGTTG CCCGTAACGG TAGCCTTATT TTGTTACAAA 
CGCCACACAG TCGTGAATCT TTCCACCACT TTGCACTCTC TCTTTGTCAG TTTCTGGGGC 
CTCCGTCTGC TCGTCTTTTT GCTGTGGCGT GAATACATCA ATTGGCCAGC ACTACATCGT 
AAGGTTGTGC AAGTCAACGA ATCTCAATCC CCATCAACGA TTGAAAAAGC TATGGGATGG 
CTTCTTTACT CGCTCCTGTA CATATGCATG CTTTCTCCTT GTTGGTTCCG ACTGCAGGAG 
AATCGAATGA ACGGGACTTG GTCCAACATA CTTCTCGCCG TACAACTCAG TGGGCTAGTA 
TTGGAATCCG TGGCTGATAT ACAAAAGAGC TTCTTCAAGG TTTCGGCACC GTCAAACAGG 
TACGAATGGT GTCACCAAGG TCTGTGGAAG TGGTCGACGC ACCCCAACTA CTTGGGAGAG 
TGGTTGTTTT GGTTAGGTAC TTACCTAGGC GGATGGTCGA CCAAAACAAG TTTCGTACAG 
TGGCTCGTCA TGTCGACCGG CTTCGCCTTT CTCACCTGGG TTCTACGTGG AGCCACAATG 
TCTTTGGAAC AAAAGTATGG CGACAAGTAC GGAAAAAATC CCGCATACAT AGGATTTACA 
GAATCTCACA CCTTTTGGGG TCCAGCGTTT TGGACAAGAT CTTTCCAGCC CACTGCTGCG 
GACACAGACC CTGTGGTTCA AGTGGTATTG GAGGAAGAAA TGCCCGACAA TGAAGAAGAA 
ACGATACTCA AAAAAGAGCA ACCATAA

Protein sequence

MKRRIIFVVL WWSQQSFDVS AIEDFFRIQS RRPRTLLAAQ TNIAASIAGL RGGNNEIPNV 
EYDEITAIKK SREQSAETKA TSINIPDAIA RDPATESPQP TSSDEASGKA AVSKQTTSNK 
STTFVPKRHT LPSLPSYWKR HGKIWKDQVA SMQLSAKPLQ LSMQQSWQVA ERHSTQFVST 
MAASIIAVFI KKQCDISFGR LYALALLGSS VGFYLFLYFI SVGYALGVAL PVTVALFCYK 
RHTVVNLSTT LHSLFVSFWG LRLLVFLLWR EYINWPALHR KVVQVNESQS PSTIEKAMGW 
LLYSLLYICM LSPCWFRLQE NRMNGTWSNI LLAVQLSGLV LESVADIQKS FFKVSAPSNR 
YEWCHQGLWK WSTHPNYLGE WLFWLGTYLG GWSTKTSFVQ WLVMSTGFAF LTWVLRGATM 
SLEQKYGDKY GKNPAYIGFT ESHTFWGPAF WTRSFQPTAA DTDPVVQVVL EEEMPDNEEE 
TILKKEQP