Gene PHATRDRAFT_41156 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_41156
Symbol
ID	7199099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011696
Strand	-
Start bp	94150
End bp	95301
Gene Length	1152 bp
Protein Length	383 aa
Translation table
GC content	44%
IMG OID
Product	predicted protein
Protein accession	XP_002185204
Protein GI	219130085
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTCTCTT CTGCAGGAAA CCCACTCAAG TCTGATGATG ATCTTAAGCT GATGCTAGAG 
AAGCTCGAAT TCATCAAGAC TGCAAAAATC TTCAGGCGTT GGAGGGGATC ATTTCTCAAC 
CGCTTCGAAA TATTCTTAGA AGAAGACAAT ATAGTGAACG CCCAAGGGGC ATACGAACAG 
TTTTCTCATA GCATGGAGGC ATTCGCAAAT CAGGTAAAGA AAGTTGAAGC GTACATAGAA 
AGCGGAGACC TTACAGCGGA CCGTTATTTT TCTTCCGTCA AGGCAAGAAA CTGCCTGAAT 
GAAATGTCTA AAATGATGGC TTCGGTTATA GAAGAAAAAG ATGCCTTGAT TCCTTCTACA 
GTCTCAATGG AAAATGACAG CGGCTACAAC AAGTTTCATA TGGGAGCTGT TCTCATTCGT 
GACAATTTCG AAGAATATGG CCGACTGACA TATTACGGAG AAAGCTTGCA GCACATGAGA 
AAGGTAACCC TGGCCGAGAT TATTGACAAG CAAATTTTAG AGCAGATGGA CAACTATGGA 
GCGAAGCTCA AAAAATTTTG CGATGTAATG GCAGATCTTG GCCTTTACGA AGTCATGCTA 
AAATGCCGTG AGTTTGCTTG TGTCGAGGAT AACAAGGATG ATCTTATATT CCTCGACCTG 
AAAACTGGTG GAATCGGCGA ATTGGATCGA GCCGCCTGTC TCGGAAAACG TGTAATCACG 
TCTACTCACA AAGATCAGGA AGGTAACGAG ATTTTCGAAG AATCCGTCTT AGACGACGAT 
GGCAAAGCAA AGCTTCTCAA AATGATACGC CAGAATCCGA GGCTAGGACT AGGTTTTGGA 
AACAGCTTGA ACTCCTTCCA GGAAGAGAGT CTCGCTACTG AAAATGCAGA AGTTATAAGA 
AGTATGTGGG GTGTGACATT GCGAAAGACA CCGAGAAACA AGAAAGGAGA GGAGTTCATC 
TTTCTCTGTC AGAAAACCGG TGTTTTCGGA GAACTTTCAC GCAAAACGTG TTTAGAGGTG 
GCGATCATTA CCGAAGTGAA GGACGAAAAT GGAGAAGCCA AAGTTTGCGA GTCACAGCTT 
GAGTTTGACG AAAGAGCGTC GCTCTTAGAG CAGATCCGAT CTCTTCTTGA TTTGGGAGTG 
CTGGAACAGT GA

Protein sequence

MVSSAGNPLK SDDDLKLMLE KLEFIKTAKI FRRWRGSFLN RFEIFLEEDN IVNAQGAYEQ 
FSHSMEAFAN QVKKVEAYIE SGDLTADRYF SSVKARNCLN EMSKMMASVI EEKDALIPST 
VSMENDSGYN KFHMGAVLIR DNFEEYGRLT YYGESLQHMR KVTLAEIIDK QILEQMDNYG 
AKLKKFCDVM ADLGLYEVML KCREFACVED NKDDLIFLDL KTGGIGELDR AACLGKRVIT 
STHKDQEGNE IFEESVLDDD GKAKLLKMIR QNPRLGLGFG NSLNSFQEES LATENAEVIR 
SMWGVTLRKT PRNKKGEEFI FLCQKTGVFG ELSRKTCLEV AIITEVKDEN GEAKVCESQL 
EFDERASLLE QIRSLLDLGV LEQ