Gene PHATRDRAFT_35781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_35781
Symbol
ID	7201019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011676
Strand	+
Start bp	736233
End bp	737390
Gene Length	1158 bp
Protein Length	385 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002180108
Protein GI	219118680
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGAAAA ATGAGATTGG GCTCATTGCG CCAACACCGG CGCTAGACAG TTTGTCCGAA 
GATGTTACCT TTCTTTGGCT CTCGGGCCAA GCGTCCATTC CCGTATACGA CGAAGTGCCA 
TCGTCACTCG TATTTCTACG TGATCATGTT GCTTTGAGCC GTCCGTGTAT CATTCGCAAT 
GCCGTTTTGG ATAAAAGTGA AAACAAATGT CCTCTGCACC TAACATTGGA CGACTTGGTT 
GACTCGGATC CGACACTCTC CTTAGTGGTA GACGTGACTC CAGACGGACA AGGCGATTGT 
TTGAGGCTTG CCCAACATCA AACCCTGGGC TGCAAACATA AAGAAAACAG TCAACGAACG 
TTTGTCAAAC CATTTGAACA CCGCATGTCC ATATCGGAGT TTCGTTCTTG TTTGCGAGCA 
ACTCGATCTG GGACGACACC ATCGCTAGAG CAAATCAAAA ATCGTATATT TCAGTCCACG 
GCCGACGTAT CATGCACTGT TTCTGAGGAA GCATTCAATC ACGGTCTTCC GACGGAAGCC 
GTTTACTACT ATTCTCGTCA AAACGATTGC TTGCGGAGCG AGCTGTACTC GTTGTGGCAA 
AAAAAGCTCT TTCCGGAGAA TTTTGTATGG GCATCCGAGG CCTTTGGTGT GCCCGAACCG 
GAGGCTGTCA ACCTTTGGTT GGGCAACGAG CAAGCAGTTT CTTCGATGCA CAAGGATCAC 
TACGAAAATT TATTCTACGT CCTATCGGGC GAGAAAGTTT TCACTCTTTG TCCTCCAGCT 
GATGCACCAT TCTTATACGA ACAGAATTGT TCGAGTGGAT GCTTTCAGTA CAGCGCGACC 
GAAGGCTGGA CGATAAGCTC CGATGTTCAT CAAGACGGAA CAACATTGAA GATCCCTTGG 
ATTTCTGCCG ACGTGGTCGA GAAAGAGAAA TCGGAGGTTC TTGATGAGTT TCCACTTTTG 
ACTTATACGC ACCCTTTGGA AGTGCACATT CGAGCTGGCG ATCTCTTGTA TTTACCGGCT 
TTGTGGTTTC ACAGAGTTAC GCAATCCTGC GAGACCGTTG GCATAAACTA CTGGTACGAT 
ATGAAATTTG ATTCACCTTC TTGGTGTTAT TTTCATTTTT TGCAATCCCT CATACCCAAC 
GAGGCCATCC AAGGCTGA

Protein sequence

MQKNEIGLIA PTPALDSLSE DVTFLWLSGQ ASIPVYDEVP SSLVFLRDHV ALSRPCIIRN 
AVLDKSENKC PLHLTLDDLV DSDPTLSLVV DVTPDGQGDC LRLAQHQTLG CKHKENSQRT 
FVKPFEHRMS ISEFRSCLRA TRSGTTPSLE QIKNRIFQST ADVSCTVSEE AFNHGLPTEA 
VYYYSRQNDC LRSELYSLWQ KKLFPENFVW ASEAFGVPEP EAVNLWLGNE QAVSSMHKDH 
YENLFYVLSG EKVFTLCPPA DAPFLYEQNC SSGCFQYSAT EGWTISSDVH QDGTTLKIPW 
ISADVVEKEK SEVLDEFPLL TYTHPLEVHI RAGDLLYLPA LWFHRVTQSC ETVGINYWYD 
MKFDSPSWCY FHFLQSLIPN EAIQG