Gene PHATRDRAFT_46145 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_46145
Symbol
ID	7201363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011677
Strand	+
Start bp	401468
End bp	402649
Gene Length	1182 bp
Protein Length	393 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002180429
Protein GI	219119333
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0356931
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCTTGT TGAATACTAT TTTCGGCAAA AACGCCGAGA AGAAATCGGA ACAAGTGTCG 
GTATTTGAAA CGAAAGTATC CGTTCCAGAA CCGAAGCCGT TGCCTCCATC AAAAATACCA 
AAAGAAAAAC CGCCTTTGAC GCCAACTGCT ACTGGCGATG GGAGTACGAA GAAACGAAAG 
CGCAAGGAAA CGAAAGTTGA GTTTACTTTG AAAGAGCCCC TCGAGGGTCC TACGGTAGAA 
AAGCCCTCAG AAGAATCCAA ACAAGCGGAA GAACGAACGG TTTTCGTCGG TAACCTACCG 
ACCCAATACA ATCGCAAAAG CCTAGCCAAA CTCTTTAAAG ACTGCGGCAA AGTAGAGAGT 
TCACGCATCC GGTCGCTTGC CGTGACGGGA GTGAAGCTAC CACAAGAAAA TGCAGGCAAT 
CAAAAGTTGG TTAAGAAGGT TTGCGCCAAC ACCTCCCAAG TCGACACTAA GGCAAAATCT 
TCCGTTCAGG GGTACGTTGT CTTCGTGAAT AAAGATGCGA TTGAAAAAGC CTTGGTGCTG 
AACAATACAG AAGTGAAGGA CGAAAGGACC GGTACAACAC GTCGGATTCG CGTCGACCAC 
GCAAATGCTG AATACGACGC TGCACGTTCC ATTTTTGTGG GAAATCTCCC GTACACTGCT 
GACGAAGACT CTTTGGCAGA ACATTTCTGC GAAGGCTGTG GTTTGAATGT AGACGACATT 
CAGGGAGTTC GAATTGTACG TGACAAGGAG ACCTTTCAAT GCAAAGGCTT CGGTTACGTG 
TTGTTTAGTG ATCAAAGCAT GGTAACATTG GCCTTGCAGC GTATGTCGGG AAGTTTATAT 
GCAAAACGTG AACTTCGAGT GATGGTTTGT GGACGGCGCT TCAAAGGTAA GAAGGGAGAT 
GCAATGCCGA AGGAAAACAA AAAGCGTAGC TTTGAAGGAC GACGAGCTTC GGCACCAGTA 
TCACCGGCTG CATCCGTAGG CGCCTTGCGA CGCATAATCA AAAAGCAAGT TTCCGAGGCC 
CCGACCAAGA AGCGCAGAGC TCGTGGGGAA AAGACCAGTG AAAAACCGAC GGCGCGCAAA 
GCGGGAGTCA GTCGAAGAGC CGCTGTAGAA GCGAAGGTCG AGAAGCGTGT CAAGAAGTTA 
CAGAAACGTG CTGCCAAAGG AATGGGAAAG AAGAAGATGT AG

Protein sequence

MSLLNTIFGK NAEKKSEQVS VFETKVSVPE PKPLPPSKIP KEKPPLTPTA TGDGSTKKRK 
RKETKVEFTL KEPLEGPTVE KPSEESKQAE ERTVFVGNLP TQYNRKSLAK LFKDCGKVES 
SRIRSLAVTG VKLPQENAGN QKLVKKVCAN TSQVDTKAKS SVQGYVVFVN KDAIEKALVL 
NNTEVKDERT GTTRRIRVDH ANAEYDAARS IFVGNLPYTA DEDSLAEHFC EGCGLNVDDI 
QGVRIVRDKE TFQCKGFGYV LFSDQSMVTL ALQRMSGSLY AKRELRVMVC GRRFKGKKGD 
AMPKENKKRS FEGRRASAPV SPAASVGALR RIIKKQVSEA PTKKRRARGE KTSEKPTARK 
AGVSRRAAVE AKVEKRVKKL QKRAAKGMGK KKM