Gene PHATRDRAFT_33867 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_33867
Symbol
ID	7197675
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011672
Strand	+
Start bp	537301
End bp	538509
Gene Length	1209 bp
Protein Length	342 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002178247
Protein GI	219114903
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.17062
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTCGAT CGCTTTTTTA CGTTGATTCT CACTGCCGGC AAAGTTGTCG GTCGTCCTTC 
ACCGCATCTT TATTCTCACT TCTCGCGTTC ACAGCTTTTT TGAAGATGGC AAAACAGTTT 
CAGCATGTTG TACGGAGAAC TGCGGGAACA AGATAGATGG CGGCATCCAG GGATTCTTCT 
ATTCCCTAGG AGCCTTTGTT GGTTCCAAGC CTCGTCAAAC GATTGGAATG GCGATTCTTT 
TCACGGTCGT TTGCGGAGCC GGTTTCGTGC GCTTCGAAAC AGAAAGCCGC GGCGAAGAGC 
TCTGGGTTCC GCAAGATACA CGGGCCGAGC AAGAAACGCT CATGTATGAA TCCTATTTTA 
ACAGTTCTAC TCGTTTTAAT ACTATGATTG TTCAGGCTGC AAATCCGGGG GGCGACGTTC 
TCACGAAGGA GATCTTGTTG GAATCAATGC TCATGCATAG CGAAATTGCC ACAAAACAAG 
CTAAGCTGGA CGGCATTGAC TATGGGCTCT TGCAGCTGTG TGTAAAGTCT GGAGGAACCT 
GTGTGTCCAG CACGGAAGGT GCTTGTCAAT GCTTGATGAC GAGTATTTTG CGCCAGTGGA 
ACTATGACTT GGCAACCTTG CACCAGGACA ATGACCGAAA TTTACGCTTC TCGCCAGTCT 
CTGGTCGAGC TTGACCAGCG CCTAACGGGT CTCTCAACAG TACCTCCTTT CATTGCCGAG 
CCTGTTTCAG AAGATGCGTA CCGCAATGTT ATGGCTGGCC TTTTCAACTT TTTGAGCACG 
TCGGGTTCGA ATGATATTGG CAACGTGACC CTAGGTGGTG ATAATTGGCC GACTACAGAA 
GCCGATTTTG TTGCCACGGT GGCGGCCTTT GCAAGCAGTT CGGGGCCCGG ATCAATTTAT 
GATCGTGATG TTACCTTCTC GCAAGATGGA TCGCAGATTG AAGCGTTTCG TGTGGAGCTC 
GAATATGTTC GGCTGACTAA GGAGAACCGC GGAGAATTGA TTGACGACGC TGCCCGCCAG 
ATTGACGCCA TGGATAGTAC CCGCGATATG GTCAATAGTT GGGACGACCT ACCGACCGCG 
TTCGCCTACT CTTCCAAGTT CATCACGATT GAGGGTTTTA AAATTATTCA ACTTGAACTT 
TTCCAGATCG TTGGGTTGGC AATTGCAGCC GTCGGCGTGA TAGTTTGCTC ACCGTTCCCA 
GTCCAATGA

Protein sequence

MSRSLFYVDS HCRQSCRFFE DGKTVSACCT ENCGNKIDGG IQGFFYSLGA FVGSKPRQTI 
GMAILFTVVC GAGFVRFETE SRGEELWVPQ DTRAEQETLM YESYFNSSTR FNTMIVQAAN 
PGGDVLTKEI LLESMLMHSE IATKQAKLDG IDYGLLQLCS LVELDQRLTG LSTVPPFIAE 
PVSEDAYRNV MAGLFNFLST SGSNDIGNVT LGGDNWPTTE ADFVATVAAF ASSSGPGSIY 
DRDVTFSQDG SQIEAFRVEL EYVRLTKENR GELIDDAARQ IDAMDSTRDM VNSWDDLPTA 
FAYSSKFITI EGFKIIQLEL FQIVGLAIAA VGVIVCSPFP VQ