Gene PHATRDRAFT_36081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_36081
Symbol
ID	7201158
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011677
Strand	+
Start bp	502625
End bp	503701
Gene Length	1077 bp
Protein Length	358 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002180448
Protein GI	219119372
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGAGCC GACTCGATGG CATTCGACGT TCTTACCAAG CCTTGACGGA ACGTCTCGCT 
GATCCTGATG TCATCAATGA CTCCAATTTA CTCCGCCAGG TAATGACCGA TCGATCACAA 
ATCGAAGAAG TCGTCATGGT ATTCGAAGAA TACGTCGCCT TGCAAGAAGA ACTGAGTGGT 
GCTAAGGAAC TGTTTCAGGA CGCCGGAGAC GATCCGGATA TGAAGGAAAT GGCGCGAGAT 
GAGATGAAAG CTATTGAACC ACAACTAGAC TCTTTGGAAG AGAAAATTAA GGTTCTGCTG 
TTGCCGAAGG ATCCAAACGA TGCTCGTAAC GTCATGCTAG AGATCCGGGC TGGTACTGGA 
GGTTCCGAAG CCAATATTTT TGCTGGTGAT TTGCTCGATG TCTATCGAAA GTATATTTCG 
ACACAAGGAT GGCAATCAAA TCTGATAGAT TCTTCTTCTG GCGATGATGG CGGGTACAAA 
AATGTCGTTT TGGATATCAA GGGCGATATG GTTTACAGTA AACTCAAATG GGAAGCAGGA 
GTTCATCGTG TTCAACGTGT ACCAGCAACA GAATCCCAAG GCCGTGTCCA TACGTCTACT 
GCTACGGTTG CTATTATGCC CGAATGTGAC GAAGTCGATA TAAAGATTGA TCCTAAGGAA 
ATCGAAATGT CGACAATGCG TTCCGGTGGT GCTGGAGGGC AGAACGTCAA CAAGGTCGAG 
ACGGCTGTCG ATTTGTTACA CAAACCGACA GGCATTCGTA TCAAGTGTAC TCAGGAGCGA 
TCGCAGCTAA AGAACAAGGA GCTGGCTATG AAAATGCTTA TGGCAAAACT TTACGACATG 
GAAAACGAGA AGCGGGAAAT GGAAGAACGA GCTCGACGAG GGTCCCAAGT TGGCACAGGA 
GGACGCAGTG AAAAGATTCG AACCTACAAC TGGAAGGATT CCCGATGCAG CGACCATCGT 
CTCGGTCAGA ACTTTCCGTT GGCACAGTTC TTGAGTGGCG ACATCGGTAG CATGCATGAT 
TCCATGATCG CAAAAGACCA AGAGGAGAGG CTGAAAGGGC TGAGCGAAGA ATCATAG

Protein sequence

MMSRLDGIRR SYQALTERLA DPDVINDSNL LRQVMTDRSQ IEEVVMVFEE YVALQEELSG 
AKELFQDAGD DPDMKEMARD EMKAIEPQLD SLEEKIKVLL LPKDPNDARN VMLEIRAGTG 
GSEANIFAGD LLDVYRKYIS TQGWQSNLID SSSGDDGGYK NVVLDIKGDM VYSKLKWEAG 
VHRVQRVPAT ESQGRVHTST ATVAIMPECD EVDIKIDPKE IEMSTMRSGG AGGQNVNKVE 
TAVDLLHKPT GIRIKCTQER SQLKNKELAM KMLMAKLYDM ENEKREMEER ARRGSQVGTG 
GRSEKIRTYN WKDSRCSDHR LGQNFPLAQF LSGDIGSMHD SMIAKDQEER LKGLSEES