Gene PHATRDRAFT_47585 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_47585
Symbol
ID	7202803
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011682
Strand	+
Start bp	172398
End bp	173488
Gene Length	1091 bp
Protein Length	271 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002181860
Protein GI	219123081
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TCACGGTCAG TGACATTCAA CCGTCCGTTC CGAGATTTCC AAGCGACAAG AGATAGTGTT 
ACGTGTGCAA CTATGTCACC ATGGCTAGGA ATGGTGCAAT TGCTGTGATT GCGAAATGCC 
CTATGGCGGG CAAGAGTAAA ACGCGTCTGA TACCTCTCTT GGGTGAACAG GGATCGGCTG 
CCTTGGCTCG TGCCATGCTC TCGGACGTTC TCACCAGTCT GTCACGTTGT GTAAGTCCAC 
TTTTACATCA AAAAGGTAGG AAACGCGCCC TCTCTTTCTC TCATGAAGTA TTCTCTATAG 
GAAGAGTTGA AGCCAGCGAA AAAAATTCTG TTCTATGCTC CCCCAACGCA GCAAGGTCTC 
GAAATAATGC GAGAAATTCT CATCAGTTTG TCACTATATA GTCAACCTCA CCAAGAATGG 
GTTTTGCTAC CGATGGTGTC GGTTTCATTG GCATCTTCAG ATCTAGGGGA TCAACTCACC 
GACGCCTTAG TGCGTGCAAG GCAAGTTCAG GTAGAAGAGC ACCATACCGC CAACGCTTTG 
CCTGGACCCG TGATATTTCT CGGCATGGAC GCCCCGGAAC TCCCACTCGG TGAATTGGTC 
TCGGCCTTTG AGCACCCCGA CACAGCTCTT TTATGTCCCT CCGACGATGG GGGCTACGGA 
ATGTTATCCG TGCCGGCAAC GGCCGATGCC GACTCCATCT TTGATGGAAT CCGGTGGTCC 
GATCCTTTAA CGGCAGTCGC ACAACTCAAG AATTTAACGG ATGGCGGTGT CCCCGTTCGG 
ATCGGACAAC TGATGCATGA TATGGACGAG CCAGACGACG TCTTAAATTT GTGCGCACGC 
TTGCGAATCC ATCATTTGCA GGATTCATCT CTCTTGCCGT CTTTGCCGAA CAATGCTAAG 
GCGAACGCCG CACCATCCGT AGATTCCAAG TACGTTAGCA AGCCAGATAT TCTGATGCAA 
CCGTCGTCGC TTCTACAGAA GCGAGAAATC TGTTTAGGAA GAAGCATGGA ATGTTCTTGC 
CATTACACCA AACAGATTTT AGTAAAATGT GCAGTTATGG TCGTTTGCTA GAGCTTCTTG 
CGCTCGCTTA A

Protein sequence

MARNGAIAVI AKCPMAGKSK TRLIPLLGEQ GSAALARAML SDVLTSLSRC EELKPAKKIL 
FYAPPTQQGL EIMREILISL SLYSQPHQEW VLLPMVSVSL ASSDLGDQLT DALVRARQVQ 
VEEHHTANAL PGPVIFLGMD APELPLGELV SAFEHPDTAL LCPSDDGGYG MLSVPATADA 
DSIFDGIRWS DPLTAVAQLK NLTDGGVPVR IGQLMHDMDE PDDVLNLCAR LRIHHLQDSS 
LLPSLPNNAK ANAAPSVDSN YGRLLELLAL A