Gene PHATRDRAFT_47461 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_47461
Symbol
ID	7202578
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011681
Strand	-
Start bp	678233
End bp	679629
Gene Length	1397 bp
Protein Length	332 aa
Translation table
GC content	58%
IMG OID
Product	predicted protein
Protein accession	XP_002181783
Protein GI	219122918
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CAGATACCTC CTCCCCGTGG TCTCTCTCAC CACCGTTTAC CGGTCCTGTG TTGGTGTGGT 
CACTCACTCA CTCACTCATT ACCTCATCGT CTGCTTACTT CCGCATTGTG CGATACACTT 
TTAAACAAGT CACATCATGT CTGTCGAGTT CCCTGTCTAT CAGATTGACT TTTCGGCGGT 
AGCTGCGGGA AAACGCGTGG CCGCTACGAA ACGGCGTATT CGATGGTACG TACCGTACCG 
TACACTACCG TACCCGACCC CTACGGTATG GGACGGTGCG AATCTTGGTG GAAGGATTCC 
GTGATGTGTC GTGGATTGGA TGTTTTCGTA GTAATCATCC CGCATTACCA TGTTGGTGTT 
GTGGTTGTTG TTGTGGTCGA TACAGCGTCT CACGAAAACG GCATCTTGCG ACGCATTTCT 
GACTTTCTCT TGTTCTTCTT CTTCTAGGCG TTTTGGTTTC CCCAATCAAG CCGCGCTCGC 
CGACGGTAAG ACGGGGATCG AATGTCGAGG TGAAGAGCAC GAAATTGTGA TTGTTTGGTC 
CGTGACTTCC GGCAAGCGGC AAATCATCAT GGACGGTCGC GAAGTGCACT TTTCCAACAC 
CCGAACGTCG CTCATGGATC ACACTTGGTC CGGAAAGGGC AATCACGTCA TGAAGGTCCT 
CTGCCACGCA TCGGCTCCCA TGTCGGCCAA CCCCGGATTC CGTCAGTACG ACTTTTTCAT 
TGACGGACAA TCCTTCTTCC GCATGCCCAA GGTCTACGAG CTCGGTGTCC GACCAGGCTC 
GAGCGCCAGT CCCCGCGGTG GAGGCTACGA CGGCGGATAC GGACCTCCTC CGCCCCGCGC 
TCCCGCCGTG CGTTCGCCCT CGACGCTTTC GCAAGAAGAC GCCGAGCTAC AAGCCGCCAT 
TAACGCCTCT CTGGAGGAAT CACGGCGTCG TCTGGGGCCA CGCGCCGGGA GTAGTGGAGG 
CGGATCCCTG GCCCCGCCCG CGGCCGATCT GCTCGATATG GGAGCGGAAC CGTCGCCGGC 
TCCTCCCGAG GCCTACTCGC AGTCCAGTTA CGACCAGGGT CAAGGGGGTC CGCCGCCGCC 
GCCGAATTAC GGCGCACAGT CGACACAACC ATCCTACTCG TACGGAGGTA CCACGGTCGC 
ACCCGGGGCG AACAGTAACC AACAGTTCTT GGCCTTGCCA TCGTCCAGTA ACTATCCGCC 
CCCGCAACAG CAACAGTACA CTCAGGGACC AACATCACCT CCGCAACAGC AACAATACAA 
CCAAGGCCCT CCACCTCCGC AACAGCAATA TTACGACCAG TCGTATGGAC AGCAATCCTT 
CCAGTCTTCT CAGGGATACG GTTCGCCGGG GCCGTCCCCC AACGGAGGTG GAGATCCGTT 
GGGTTTGCAT ACGGCGG

Protein sequence

MSVEFPVYQI DFSAVAAGKR VAATKRRIRW RFGFPNQAAL ADGKTGIECR GEEHEIVIVW 
SVTSGKRQII MDGREVHFSN TRTSLMDHTW SGKGNHVMKV LCHASAPMSA NPGFRQYDFF 
IDGQSFFRMP KVYELGVRPG SSASPRAPAV RSPSTLSQED AELQAAINAS LEESRRRLGP 
RAGSSGGGSL APPAADLLDM GAEPSPAPPE AYSQSSYDQG QGGPPPPPNY GAQSTQPSYS 
YGGTTVAPGA NSNQQFLALP SSSNYPPPQQ QQYTQGPTSP PQQQQYNQGP PPPQQQYYDQ 
SYGQQSFQSS QGYGSPGPSP NGGGDPLGLH TA