Gene PHATRDRAFT_54731 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_54731
Symbol	APX1
ID	7202439
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011681
Strand	-
Start bp	518716
End bp	519987
Gene Length	1272 bp
Protein Length	261 aa
Translation table
GC content	50%
IMG OID
Product	ascorbate peroxidase
Protein accession	XP_002181742
Protein GI	219122832
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGGATCGTCT CTCTACGAGG CTGCACGTTT GTCACTGTCA GTGACCCTTG TACATTGTCA 
AGAGCCTGTT TCGCACCTCA AGGGCTGCTT CGCATTCCAA TCCAGTAGTG AGGCCCATAC 
AATAGTGTCT TGATACTGTT TTTCAAGAAT TCTTGCTCTC GACTGTGAAT AAGGTAAGTT 
GTGGCGAAAT TACTTTACTG ATAACTCTAA GGAACCGCAT CGCAGCGCTT CTTTCGAATG 
ACAACTTCTC ATACGCCGTG GTCCCCTCTG ACGATTTAGC AATACAATGC CCGTCTCGAA 
AGAAGCACTT TCCTCGGCAA AAGAGATGAT CGATGCCCTC ATTCTGGAGA AAAATTGCGG 
TCCAATCATG GTACGCGTGG GCTGGCACGA TTCAGGCACG TTCGATAAAA ACGTCAGCGG 
CGCATGGCCT AGTGCCGGGG GTGCAGTCGG TTCCATCCGT TTCGATCCCG AAATTACGCA 
CGGTGCCAAC GCCGGTTTGA TCAACGCCAT CAAGCTCTTG GAGCCTATCA AAGAGGCCAA 
TCCGGATGTC AGCTACGCTG ATATTTTTCA GATGGCGTCG GCTCGTTCCA TCGAATTGGC 
GGGAGGTCCT CGGATTGACA TGAAGTACGG ACGAATCGAT TCAAACGGTC CCGAAAACTG 
CTCCAAAGAA GGCAACCTGC CCGATGCCGA ACCGGGAAGC AACGGCATGT ACGGTGGTCC 
TGGTGGTAGT GCATCTACGG AAGATTCGAC GGCAGCCGGT CATTTACGTA AAGTCTTCTA 
CCGCATGGGA CTGAATGATG AGGAGATTGT TGCTCTCTCC GGTGCCCACA CCTTTGGCCG 
CGCTTACAAA AACCGTTCCG GTCTCGGGGC TGAAAAGACT AAATTTACGG ATGGAAGTAA 
ACAAATGCGA GCGGATGGCA TCGAGGCCAA GTATACTCCA GGTGGTTCGA GCTGGACGGA 
GAATTTTCTC ATTTTCGACA ATTCGTACTA CAAGGTCATC CCAGACGAGT CCGCCGATCC 
TGAACTACTC AAGTTGTCAA CTGACAAGGT AGTTTTTATG GACGATGGGT TTAGGCCATT 
TGCCGAGAAA TTCCGTGACT CGCAGGATGC TTTCTTCGAG TCATACGCCA AGGCGCACAA 
GAAGCTGTCC GAACTCGGAT CCAACTTTGA CCCGTCGGAA GGCATATCCA TGTAAACATG 
ACCCGAATTC AATTATATGA GTGTTACCTT TTGTTTCCGT AGAAAAAATC TACTAGCTAC 
TCGTTGGGTT CC

Protein sequence

MPVSKEALSS AKEMIDALIL EKNCGPIMVR VGWHDSGTFD KNVSGAWPSA GGAVGSIRFD 
PEITHGANAG LINAIKLLEP IKEANPDVSY ADIFQMASAR SIELAGGPRI DMKYGRIDSN 
GPENCSKEGN LPDAEPGSNG MYAGHLRKVF YRMGLNDEEI VALSGAHTFG RAYKNRSGGS 
SWTENFLIFD NSYYKVIPDE SADPELLKLS TDKVVFMDDG FRPFAEKFRD SQDAFFESYA 
KAHKKLSELG SNFDPSEGIS M