Gene PHATRDRAFT_40891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_40891
Symbol
ID	7198729
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011694
Strand	-
Start bp	208291
End bp	209454
Gene Length	1164 bp
Protein Length	364 aa
Translation table
GC content	52%
IMG OID
Product	predicted protein
Protein accession	XP_002184915
Protein GI	219129478
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.656678
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGAAC CAACGCGCGA CACTATGGTG CGCTCACCGA TGCGTCAAAA CCGATCCGTA 
CTCGTTACCT TTCTCGCAGC GCTCGTTGCT TTAGCGGGGA CTGTGGTTGA TGCGCAGGTA 
GGCGTAGATA TCTGCGCGTG CCAGCCTAGC ACCTATGAGT TTACGTTAGA CTTTGCATCG 
ACGCTTCCCG CCAACTGCGA TCTGGGCGAG ATTATTGGTC CGGGTCTCAA TGAAACAACC 
TGCCGGATTA CGAGATTGAA TGATCCTAAT GATGCAGGAG ACCCAGACCT TATGCCAGTT 
TCTGTAACTG ATATTCAGGT TCTCGAGCTG GACCAGAATT TACTGCCCCT AGTCCAGACA 
CCAATCGTTG GTGACTTTCG TAGTGGCGAT ACCTTTCGAT ACACTTCTAT AATCGCCAAT 
GGCCTGGGTC CTGATCCCAT GGCTGTTCCT CGTGGTTTTT TGATGACCAT AAACGGCCGG 
AATAGCCTTG ACGAGGACTT GCAGCAACGC TGGGTCATTT TGTACGACAA CGACTGTGGT 
ATTTTCCCAA TTTTGTTTGA GGGTACGCAA TTGGGATGGA CGGTATTTGT AAGTTTACGA 
GCGACCAGGA ACATGATATT TGCTGGGGTT TCTCACCTTT CCTCTTTACG AAAATAGAGC 
GACCTTGGAG CCCCGCCTAT TGAAGTCTGT CCTTTGGCAC CAGCACCAGT CACCGATGCA 
CCCTCGGTCG CTCCCATTAT GGCGCCCCCA CTTACCCCAA CACCAACAGT GATAGCTGCG 
GAAGTTTCGG AATCCCCATC TTTGTCACCT CTTACTCCAG GTACCGAAGC GCCCGTTTCT 
GCCCCACTAA CAAATGCCCC GGTGACTCGT GCCCCAGTCA ATCCACCCGC TACTGGTGCA 
CCGGCAACCT CTTCTCCCGT GACACGAGCT CCTGTATCAC CAAACCCCAA GTCATCCTTA 
CCTAGCAAGG GGGGCAGCAA GGGATCATAC GGCATGCCGG AAAGTAGCAA GGGATCATAC 
GGTATGCCGG AAAGTAGCAA GGGGTCATAC GGCATGCCGG AAAGCAGCAA GGGAGCAACG 
GCTGGCTCAG CGTCCTCCAC GAGTCAGAAA TCTCAGAGTG ATGAACAGAG AAACAAGAAG 
CGTGGGGGAA TCAGACGCTT CTAA

Protein sequence

MIEPTRDTMV RSPMRQNRSV LVTFLAALVA LAGTVVDAQV GVDICACQPS TYEFTLDFAS 
TLPANCDLGE IIGPGLNETT CRITRLNDPN DAGDPDLMPV SVTDIQVLEL DQNLLPLVQT 
PIVGDFRSGD TFRYTSIIAN GLGPDPMAVP RGFLMTINGR NSLDEDLQQR WVILYDNDCG 
IFPILFEGTQ LGWTVFSDLG APPIEVCPLA PAPVTDAPSV APIMAPPLTP TPTVIAAEVS 
ESPSLSPLTP GTEAPVSAPL TNAPVTRAPV NPPATGAPAT SSPVTRAPVS PNPKSSLPSK 
GGSKGSYGMP ESSKGSYGMP ESSKGSYGMP ESSKGATAGS ASSTSQKSQS DEQRNKKRGG 
IRRF