Gene PHATRDRAFT_20331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_20331
Symbol	PsbO
ID	7201024
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011676
Strand	-
Start bp	759421
End bp	760679
Gene Length	1259 bp
Protein Length	308 aa
Translation table
GC content	50%
IMG OID
Product	oxygen-evolving enhancer protein 1 precursor
Protein accession	XP_002180309
Protein GI	219119085
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TATACCGAAG CAATCTTGAC CATGAAGTTC ACTGCCGCCT GCTCTATTGC CCTCGCTGCT 
TCGGCTTCGG CCTTTGCCCC GATTCCCTCG GTTAGCGTGA GTTGATTTTG CAGTGGCCAT 
GATAGGAAAC GGTCGAGAGT TGCAGAGAAC AAAAGCTGTT GAGCATTATG CCCTTTATTT 
CGTTCTTCGT CTGCGCTGTT TACGTCACAA TGAATTTTAT TGGCAGTAAC TTTTTTGTTG 
TTGGCTGTAG TGATTTGTGT CTGACAAGTT TCGTTTTCGC CCTTATTGAT ACTGCAGCGT 
ACCACCGATC TTAGCATGTC TTTGCAAAAG GATCTCGCTA ATGTCGGCAA GGTTGCCGCT 
GCCGGAGCCC TTGCCTTCGG TCTCGCCACG GCCCCAGCCA ATGCGTTAAC CAAGAGCCAG 
ATCAATGAGC TCTCCTACTT GCAGGTCAAG GGAACCGGTT TGGCAAACCG CTGCCCGGAA 
GTCGTCGGAG AAGACAGCAT CACCCCCAAG GGCGGACAAC GTCTCGTCGA TATGTGCATT 
GAACCCAAGG CCTGGGCTGT AGAAGAGGAA ATTGGCAAGG CTGGGCGCAC CGAAAAGAAG 
TTTGTCAATT CCAAGGTCAT GACTCGTCAG ACGTACACTC TTGATGGAAT TGAGGGTGCT 
TTGAAGTCCG AAGGAGGAAG TATCGTCTTC CAGGAACAGG AAGGCATTGA TTATGCTGCC 
ACTACCGTTC AGCTTCCAGG TGGGGAACGT GTTCCTTTCC TTTTTACCGT CAAAGACTTG 
GTTGCCAAGG GTAACGGTGG ATCTTTCAAG CCTGGTTTCC AAATGGGAGG CGACTTCAAT 
ACTCCTTCCT ACCGTACTGG TCTCTTCCTT GATCCCAAGG GACGTGGTGG AACCACCGGA 
TACGACATGG CTGTTGCCCT TCCTGGTCTT CAATCCGGAG AAGAGGGTGA CGATGACCTT 
TTCAAAGAGA ACAACAAGAC CTTCGACATC ACTACTGGCC GTATCGAAAT GGAAGTCAAC 
AAGGTCAATG CGGAAGAGCA GGAAATTGGA GGTGTCTTTG TTGCCACTCA GCTGTCCGAC 
ACCGATATGG GATCAAAGGT GCCTAAGAAA GTTCTCACTA AGGGTATCTT CTACGCCCGT 
GTCGAGTAAA CATGTTTCAC TATGCTAGTG CAGCTTTCGA GACGAATTGC GATGGTGACG 
GTCGACGGTT TAGCTCTAGC CTTTCGTCCC AATAGAACCT CTTTTTCACC ACAATCTTA

Protein sequence

MKFTAACSIA LAASASAFAP IPSVSRTTDL SMSLQKDLAN VGKVAAAGAL AFGLATAPAN 
ALTKSQINEL SYLQVKGTGL ANRCPEVVGE DSITPKGGQR LVDMCIEPKA WAVEEEIGKA 
GRTEKKFVNS KVMTRQTYTL DGIEGALKSE GGSIVFQEQE GIDYAATTVQ LPGGERVPFL 
FTVKDLVAKG NGGSFKPGFQ MGGDFNTPSY RTGLFLDPKG RGGTTGYDMA VALPGLQSGE 
EGDDDLFKEN NKTFDITTGR IEMEVNKVNA EEQEIGGVFV ATQLSDTDMG SKVPKKVLTK 
GIFYARVE