Gene PHATRDRAFT_42479 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_42479
Symbol
ID	7196669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	-
Start bp	179015
End bp	180370
Gene Length	1356 bp
Protein Length	391 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002177035
Protein GI	219110567
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0629377
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GAATCTCGAA AAAGGCCCAT CTTCCTGACC CATTGCCGGT AGGCCTATTC GTATCCGTCT 
CCGAATATAG GACACCACAA GGCAACACAA ACCATGGTAT CTTCAACTGC TGTAGCGGCT 
GCTTTGCTCA GTACGGGTCT AATTAGTTTG GCTCCGAATC TCATTCTCTT GGCCTTTCCC 
CGTTACACTG CGGGAAGCGG TGTTCATTCG CACCTTCTGC AGTTGGGACA AGCGCTTGCC 
GCCGGTGCCT TGTTGGGAGA TGTCTTTTTG CACGTCTTGC CACACGCGAG TGCCACGGAT 
CCGAACGTCG GCGCTTGGAT TCTTGTCGGA TTCAGCGTTT TCTTTGCGGC TGATCTCCTC 
ATTCGATCAC TTGAGCAACA GCAATACGAA CCTCACCATC AAAGTCATTC CCACCACCAC 
GGCAAGGCAG ACAGCAAAAG TAATCCCCTT TCAAAAAAAG AATCCTCCCA CCAAATTCCT 
GACGAAAACG ACGACGATTC TTCTTTGAGC ACTACGGATA TCAAAGTCTC CACGGTGCTG 
TTGAATTTAG CGGCCGATGC GCTGCACAAC TTTTCCGACG GCCTCGCCAT TGGAGCGAGT 
TTTGCCACGC TGCAACAACT GAATCCCCAG CATCAAAGTG GTGGCACCAC AAATGCAACA 
TCAACGGTTG CGGACAGCGT CCTTTCCATG GCTTCGCTTT GGGCCTCCCG CGGAGGATTG 
GCGACCCTGT CCGTGCTCTT TCACGAAATT CCTCACGAGC TGGGTGACTT TTGTACTTTG 
GTAAAGGCTG GCTACAGTCA CAAACAAGCC GTAGCGGCAC AGTTTCTCAC TGCCATTGCA 
GCTTTTGTCG GGACCGTACT GGCACTCTAT CTGACTAGCA AAAATGAGAA CAATATGGAC 
AGCTGGTTGG GTGGGGAAAA TTTGGTGCAT TTGACCGCCG GTGGCTTTAT TTATCTAGCA 
GCGACCAATA TTTTACCGGA TGTTCTGGAC GAACGGGTCT CTCCGTCCTT TCGTCTTGCG 
CAGTTGATGG CCTTTGGTAC TGGTATTGCC TTCTTATACA TGGTGGCCTT ATTGGAAGAT 
CACGATCACG ATCATCAACA CGGCTCGGGA CATACACATG AAAAGCACGT TCACTATCAA 
CACGGCTCTC CTTTTCCGAT GGAGGATTAT TATTATCAGC ATCCAACTTT GGATGCCCAT 
CACCATCATT TCCAGGTCTC GGATTTTCAT AAACTGCATC AGCACCATCA CGCGCACAGT 
GAACTATAGG AATTGGTGTC ATTTCCTTCC TCTATTCATT TCTACGCACA TGACTATCCA 
ATATGGCTTA CAATTTTTAT CACACACATA TTTAAA

Protein sequence

MVSSTAVAAA LLSTGLISLA PNLILLAFPR YTAGSGVHSH LLQLGQALAA GALLGDVFLH 
VLPHASATDP NVGAWILVGF SVFFAADLLI RSLEQQQYEP HHQSHSHHHG KADSKSNPLS 
KKESSHQIPD ENDDDSSLST TDIKVSTVLL NLAADALHNF SDGLAIGASF ATLQQLNPQH 
QSGGTTNATS TVADSVLSMA SLWASRGGLA TLSVLFHEIP HELGDFCTLV KAGYSHKQAV 
AAQFLTAIAA FVGTVLALYL TSKNENNMDS WLGGENLVHL TAGGFIYLAA TNILPDVLDE 
RVSPSFRLAQ LMAFGTGIAF LYMVALLEDH DHDHQHGSGH THEKHVHYQH GSPFPMEDYY 
YQHPTLDAHH HHFQVSDFHK LHQHHHAHSE L