Gene PHATRDRAFT_47589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_47589
Symbol
ID	7202644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011682
Strand	+
Start bp	184028
End bp	185421
Gene Length	1394 bp
Protein Length	422 aa
Translation table
GC content	53%
IMG OID
Product	predicted protein
Protein accession	XP_002181863
Protein GI	219123087
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00364513
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CCTCGGTGTA GTAGCATATA AAGGTCATTT TGCATTTACA CGACCACATC CAACGAAGTG 
TAAGTATCTC TGTATAGTTT ATTCACAGGT AGAGGAGACT GCTGGTTTCA GGAACCTACA 
ACGCCATGAA TTCGAACTCC CCTTTTTCGG CACACAGCGA TATTCTGGAT GCCCCCCTCC 
CATCCAAGGA CGACCCCGCT ACCAGGCTCC GCCTCGTGGA AGAATGCAAA TCGCGTGGAA 
AGGCTGCCGT CCAGGCGGGC CACTGGCCGG ATGCGGCGGC TTTGTACGGA AAAGCTTTGG 
AGTGCTACGT CGGTCAGGAT AGCGATACTG CCAAAACCGA AACGGCGATC TTGTACTCCA 
ACGTCTCGTT GGTTCGCGCC AAAATGAGCC AATGGTCAAT GGCACAGGAA GCTGCCCAAC 
AAGCGGTCCA AGCCGACCAA GTCTACGTAA AAGGATGGTG GAGGCTGGGA CAGGCGGAGT 
CAGCTATGGG AAACTACACA AAATCGGTTG AGGCCTTGCA GCAGGCCACA AAATTAGAAC 
CGGATAATAA GGCATTGCAA AAGGAGCTGA CCAAGCAAGA GGAGAAGGCG AAGAAAGCAG 
CCGAGGAGAA AAAGAAAGAA GCCGATACGC CGGCGGCAAT GCGAGTGGAT GAGCCACAAA 
CAATTGAAAA GAAAGCTGCG GCAACGGATT CTAATTCGAC TCCTTCCAGC ACTGCCAAAA 
CAAAAGAGGA CGACAGTGCC ATGCAAGTTG ACATTGACGG AACTGATTTT TCCAAATCGG 
AACACATCCG TGGCTACAAA ATTGTCAACG GGAAGAAAAC ATCTTTTTTT CACAACGAAC 
TGTCCGAAGA CGCGGCGAGA TTAATTGGTG ACATTGCCCC CAAAAAGTTG GACGCCGACA 
CGGGATCGTC TAGTACAGCC GCCGGAGCGA AAGGGACGTC GGCTTGGAAT CAGGCCGGGA 
CCTGGGAAGA GAAGGACGTA ACCAACTGGG CGAAAACTTC GCTGCGAGAA CGGCTTTTGG 
CAACGACATA CACGCTTCCC GAATCCTCTC CCGCACCCGG TGCCTTGGTG CTCGTAACGG 
AGGCCAAAGT GACGGGCAAC GCCAGCTGTG CGGCGGTGAG GGGCAAGAAA CGGTACATTT 
ACGAATTGTG CGTCACTTTG GACTGGAGTT TCTCGCACGG GGACCACCAG GCTGACGGGA 
GTATCGTTCT GCCGGACGTG GACGGCACTT GCGTATTGGG TGATGGCTAC GAGGAAGCGA 
ATTGGAAGGT CGATCGCGCG GATGATCCCA GCATGCGACC GCTGCTCGAA ACCTTTGTCC 
ATAAACAAGG ATGGCGTGAG GCAATTCATG AAACGATTGA CGATTGGGTG CGCCATTTCA 
AAGACACGTA TTAG

Protein sequence

MNSNSPFSAH SDILDAPLPS KDDPATRLRL VEECKSRGKA AVQAGHWPDA AALYGKALEC 
YVGQDSDTAK TETAILYSNV SLVRAKMSQW SMAQEAAQQA VQADQVYVKG WWRLGQAESA 
MGNYTKSVEA LQQATKLEPD NKALQKELTK QEEKAKKAAE EKKKEADTPA AMRVDEPQTI 
EKKAAATDSN STPSSTAKTK EDDSAMQVDI DGTDFSKSEH IRGYKIVNGK KTSFFHNELS 
EDAARLIGDI APKKLDADTG SSSTAAGAKG TSAWNQAGTW EEKDVTNWAK TSLRERLLAT 
TYTLPESSPA PGALVLVTEA KVTGNASCAA VRGKKRYIYE LCVTLDWSFS HGDHQADGSI 
VLPDVDGTCV LGDGYEEANW KVDRADDPSM RPLLETFVHK QGWREAIHET IDDWVRHFKD 
TY