Gene PHATRDRAFT_42677 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_42677
Symbol
ID	7196330
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	-
Start bp	763427
End bp	765232
Gene Length	1806 bp
Protein Length	521 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002177156
Protein GI	219110809
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0989203
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CAACGTACTC GCATCAGTGA ACGAGCACTT CGCTTTATAC CATTGCATCC TACAAGAGCT 
ACGATAGCAC TGTTTTAAAG AGTTGCTTCC AATTAATATG CTTGTGGGAG CTCTGGATGT 
CGTTAAATCA TACTTGCCGG ACTGGCCGGA ATGGTAAATA TAACTGTTGC TTCACTGAAA 
GGTGCCTGTG TCGCCGGTGT CTTTAATAGC CTGTAATTTT CTTGCAATAG GGCGTTGGAT 
ATTCTTTTAC TGATGACTGG CTTACTGATT GCTACCGGCA TCATATCGAC GCTCTACGTT 
CCCGACGAAG AGAAAGAAGA CAAGGAATAT GTGCAAAAAC ACCCGGCAGA TGCTGCACAG 
GTCTCGAACC GGAAGCCTGC AGCTCACTGG TGTAGATTTA CCGTTGTCGA GCTAAAGCAA 
GAGCTGCGCG AGCGTGGACT TCGTGTCAGC GGTCTCAAGC ATGAGCTTGT CGATCGCCTA 
GCCGAATTTG AAGCAATGTC CCCGGCGCGA CAAAAAGGAC AGGTCGAAGA GACAAAACTG 
CATCATCACG AGCTGCTGAC CGAGTTTCAC GGCTTTCGCA CCATGTACGT GACGGTGTAT 
GCTGTCATAA TGCTGGCAGA TTGGATGCAG GGAACGCACA TGTACACGCT ATACATGTCT 
TATGGAGTCA ACGTTTCTGC TCTATTTTTG ACTGGGTTTT TGAGCGGAGG TATTTTTGCG 
CCCTTTCTTG GTTCTTTCGT AGACAAGTTT GGTCGCAAAC GATCTTGTAT TGTCTACTGT 
GTTTTGGAAA TCCTTATAAA TGTCATGGAG GGTTTCGACA ATTTTACAAT TCTTCTGGTG 
GGGCGTGTTA TGGGGGGTGT CAGCACGAAC CTCTTGTTCT CGGCCTTTGA AAGTTGGATG 
ACAACGGAGC ACAGAAAGCG GGGATACCCC GACGAGTGGC TTTCGCGAAC CTACTCTCAG 
TGCTCAATTG TTAATGGGAG CACTGCTGTT ATGGCTGGCA TTGTCGCTCA GGTATTGGAG 
GATTTTCTCG GACAAATTGG ACCCTTCCAC GGTGCTGTGG GCCTAACCAC TTTGGCTCTT 
TTGCTAATTC TGGGTTGGGA GGAAAATTAT GGCGAGGAAC AAAGAGGAGA TCACGAAAAA 
TCGAGTTTGA CACACCAATT TATTGAGGGT TGGAAAACAA CGATTTCTAA TTCGAATGTC 
TGGCGCATTG GCTTGACACA GGCGCTCTCC GAGGGAGCCA TGTATACCTT CGTTTTCATG 
TGGGTTCCGA CTCTTTTGTC GTTAGATCCA CCTGGCGGTG TACCGACAGG GTGTGTCTTT 
TCGGCTCTAA TGATGTCGAT AACAATTGGC GGCCTTTTAT TTCCTCTGCT GCAGGCCGGA 
ATCAACGCGT TTGTCCCCAA AGACAGTTCG TCGGAATTGT GCGCATCCTT CGTGTACCTT 
CTTGCTAGTG CTAGTATGGC AATTCCGGTT CTGTGCCTGT CCGCCATTGA AACACCCGGA 
GGCCTAAATT GCCAGCAAAT GGTCATTGGT AGCTTTCTGA TCGTCGAGTT TTGCGTTGGG 
CTGTTCATGC CTGTGGCTGG AACTCTTCGA TCGAAGTATG TTCCAGATGC CCTGCAAGGT 
GCCATTCTCA ATATTTTCCG TCTTCCTTTG AACGCTGTTG TTGTTTCGGG CACTTACGCC 
ACAAATGTTT TAGAAGCAAG TATTGTCTTC AAGCTGGTCA GCGCCTGCTT CTTTGCGGCT 
GCTATTATAC AGGCTACGAT GATCACATCA ATACCAAAGC CCCTGAGCAA ATCAAAGACA 
GAATAG

Protein sequence

MLVGALDVVK SYLPDWPEWA LDILLLMTGL LIATGIISTL YVPDEEKEDK EYVQKHPADA 
AQVSNRKPAA HWCRFTVVEL KQELRERGLR VSGLKHELVD RLAEFEAMSP ARQKGQVEET 
KLHHHELLTE FHGFRTMYVT VYAVIMLADW MQGTHMYTLY MSYGVNVSAL FLTGFLSGGI 
FAPFLGSFVD KFGRKRSCIV YCVLEILINV MEGFDNFTIL LVGRVMGGVS TNLLFSAFES 
WMTTEHRKRG YPDEWLSRTY SQCSIVNGST AVMAGIVAQV LEDFLGQIGP FHGAVGLTTL 
ALLLILGWEE NYGEEQRGDH EKSSLTHQFI EGWKTTISNS NVWRIGLTQA LSEGAMYTFV 
FMWVPTLLSL DPPGGVPTGC VFSALMMSIT IGGLLFPLLQ AGINAFVPKD SSSELCASFV 
YLLASASMAI PVLCLSAIET PGGLNCQQMV IGSFLIVEFC VGLFMPVAGT LRSKYVPDAL 
QGAILNIFRL PLNAVVVSGT YATNATMITS IPKPLSKSKT E