Gene PHATRDRAFT_50366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_50366
Symbol
ID	7199146
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011697
Strand	-
Start bp	93101
End bp	94476
Gene Length	1376 bp
Protein Length	380 aa
Translation table
GC content	45%
IMG OID
Product	predicted protein
Protein accession	XP_002185326
Protein GI	219130342
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.365793
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGCCGTCCAG CAAACGAAAC TAACATCTCA CAACTCAAAC CGAAGCGAAG CATTCAAACC 
ACACACCCAC TAAAAACAAA CACGAAACAT CCATCATGTC GAACGAAGAA AACAATACGA 
ACATTGACGA AACGCAGGAG ACGGAGCAGC ACGATCCACA GGAAACAAAG TCGGAGAATA 
CTCCGCAAAA AGAAGACTCG CACGAGAAGG ATTACCATGA AGTGAAATCA GTCGGTAAAG 
GGCACTCATC TGCACCGAAG CAAAAAACGA AGATTTCCGA ACGCCTCGAC GAAGCGGTGA 
AAGAAATGAA GGCCATCAAT CGGAGTTCTG ATTTAGTGCC TCTCAATCAT CAGTATGATG 
TACTGCGCAA GCGCCTCCGT GCTTTGATTG TCAAAGCTAA GGAATTTCAT GCTGCGAAGA 
TCTTGCTCAC ACAAAACCGA ACAGAGGTAG GAATGGAAAT CATCTTGTGC ATCAACTTGT 
CAGTCCGGGT CTGACATTGT TTCTTGTTTT AAAGATGGTC AAACAACTCA GTCTTATGGC 
CAAGGGTAGT CCAATAGACG AAAAAATTGG CAGCACGGAA AGTCAAGATT CATTTGCAAC 
CGTTGACCGC GCAATTGAAA CCAGGGTACA AAGTGATATG CAAAAGTTCC AAAGGAACAT 
TATTGATTAT GCTCTAGAAT GGGAGGACAT TGTGACGACC CGCGTCGACT CTGATCTGAA 
GGACACGACG AAGCTGAATG AAAGATTGAA CCATTATCAG AATAAAGTTG AAGGAATTCG 
CAAAAAAGTC AACGCGAAGG AAAGCAAGTT AGTTTCTCGC GGAAAGGATC CTTCGGCGAC 
TCCCACGAAA CTTAACCAAA AGCTCGAACG TAATGAAGCG AAACTGAACC ATGCTTGGAA 
AGCACACGAA GCAAGTGCAT CTAAGCTTTG TAACTTAATG GAGGAGGCCA CACAGCGCGG 
TTGGAAAGAC CTCTTTCCTT TAGTGAAAGC AGCAATAGAT TGGCAGGCTG AGACTGCGTC 
GGGAGAGTAC GATATTTTTG CCCGCCTTCC TTCAGTGGCG ACTGAACTGG CCGACCTTTT 
CGAAGAGAAG AATCAGGCTT CAGAGAAAAA TAGCTCAGGT GTTCCACTAG CCACAGATGA 
TGATGGTTCG GGGGATTCGG ACACTACTGG ATCCGCCCCT CACGATGACA CCAGTTTCTC 
AGGCTCGGAG ATTTCGAACG GCGGAAACTA CGCAGATTCT GGAAGTCCCA CTGTGGGAGG 
ACACAAAGGA TCAGAGAGTC CACGACATGT TGATTTGACT TGTTAGGTAA AAATTGTTGT 
TTGGTTCATA TGTTTTTAAG TTATAACAAA CGATTCGATA ACATGGTTAT ATGCTT

Protein sequence

MSNEENNTNI DETQETEQHD PQETKSENTP QKEDSHEKDY HEVKSVGKGH SSAPKQKTKI 
SERLDEAVKE MKAINRSSDL VPLNHQYDVL RKRLRALIVK AKEFHAAKIL LTQNRTEMVK 
QLSLMAKGSP IDEKIGSTES QDSFATVDRA IETRVQSDMQ KFQRNIIDYA LEWEDIVTTR 
VDSDLKDTTK LNERLNHYQN KVEGIRKKVN AKESKLVSRG KDPSATPTKL NQKLERNEAK 
LNHAWKAHEA SASKLCNLME EATQRGWKDL FPLVKAAIDW QAETASGEYD IFARLPSVAT 
ELADLFEEKN QASEKNSSGV PLATDDDGSG DSDTTGSAPH DDTSFSGSEI SNGGNYADSG 
SPTVGGHKGS ESPRHVDLTC