Gene PHATRDRAFT_47042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_47042
Symbol
ID	7202140
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011680
Strand	+
Start bp	255990
End bp	257148
Gene Length	1159 bp
Protein Length	363 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002181169
Protein GI	219121637
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.109965
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TCTGAAGTTA GGCCGTCTGG GGAGCAATGG CTGAAGAACA GGGCACAAGC GATGAGCTTG 
ATGCTTTGAT TGAAGAACAG CGGTGGGACA GCGCTTTCGT AAGATTGCTC GCCAACCCCG 
ACGAAGCCAA GAAATCGCGA ATCCGTCACT AGGTTGGACC AAGTTGCACT GGTTGTGCTC 
AATAGGTGCA ACTCCTTTTG AATTGCTAGA TCTTGTGGCT TCTCTCTACC CTGATGCCAT 
CACAATGCCA GATCGTCGCT GCAACGACAC CCCTTTGCAT CTTGTCTGTC GACAATCCCA 
AACATCTTCT AAGCGAGTGA AGGCCTTGCT GGCACATTTG AAGGATCCCG ACGGTGTTCT 
CATTCGGAAT CGATTTGGCG GGACGTCTTT GCACTCTGCA GCCAACCACA ACGCAACGAT 
TGAGACTTTT CGGGAGCTTG TCAGGACAAA CTCCCGAATA GTTCGAGTAG CTACTCGGGA 
AGGTGTATAC GCCGTGGCTA CTCTTTGGCA TGCTTATGTC CAAACCATTC AGGGACATAT 
GTGCATAGCC CATGCCCTGA AGGGAGACAA TATTTCTAGT GAACACTTTG CTCGATTTTG 
GGAAAAGGCT AAGTTTCTTG CCTCGGAATA TTTCCGCCGT ACCACAGCGT GCCCTGAGGA 
AATTGACAAT CGAACAAGAT TTGTTCTTCA TGGTCTCATT CAGTGCAATG TAGACATCAG 
CTTTTTCAAG ATCGCTCTCA AAATCGAGCC TGGTTTGGCA ATAACGCCAA ATGCTCAAGG 
AAGCCTGCCA CTACACATTC TTGTCAAAGA TCGTCCTTAT CGTCTGAAAG AACGCCAGGC 
TATTGTGGCC GCTCTACAGG CGTATCCAAG AGCAGCTCTC ATTGCAAATA AAGCGGGATA 
TACACCACTC TTAATTGCTA TCGGAAGCAA ATTGCCCTGG GAAAATGGTC TTGATTGTAT 
TGCGAACGCA GCTTTGAGCA TGATCCAAAG GCGGGATCCT TTAACCGGTC TGTTTCCGTT 
CCTGCTAGCG GCGTCAAATG GAGGTCCAAT GTCTGTTTCA ACTACCTATC ATTTGTTGAG 
CGCCCGTCCA GATCTACTCC GTCCGCGAGA TACAGCTGAA ACCAATTTCC ATGTTCAGTC 
TAGTTCTCTG TATGGTTGA

Protein sequence

MAEEQGTSDE LDALIEEQRW DSAFVRLLAN PDEAKKSRIR ATPFELLDLV ASLYPDAITM 
PDRRCNDTPL HLVCRQSQTS SKRVKALLAH LKDPDGVLIR NRFGGTSLHS AANHNATIET 
FRELVRTNSR IVRVATREGV YAVATLWHAY VQTIQGHMCI AHALKGDNIS SEHFARFWEK 
AKFLASEYFR RTTACPEEID NRTRFVLHGL IQCNVDISFF KIALKIEPGL AITPNAQGSL 
PLHILVKDRP YRLKERQAIV AALQAYPRAA LIANKAGYTP LLIAIGSKLP WENGLDCIAN 
AALSMIQRRD PLTGLFPFLL AASNGGPMSV STTYHLLSAR PDLLRPRDTA ETNFHVQSSS 
LYG