Gene PHATRDRAFT_39523 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_39523
Symbol
ID	7195351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011688
Strand	+
Start bp	48662
End bp	49840
Gene Length	1179 bp
Protein Length	392 aa
Translation table
GC content	52%
IMG OID
Product	predicted protein
Protein accession	XP_002183538
Protein GI	219126594
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGCCAG ATGGAAACAC AAAGCGCCAA GCAAAGCAAG TTGCGTCCGA GAGCAAGGGG 
CCTGTCGAAG TCAGTGACGA CACCGCGACG AGGTCAAAAA GGCCGCGAAA GACCTCAAGG 
TCAGCCGGAA AAACCAGCGC TTCGAAACGC CGTCGATGTG CACGTGGCGC GGGAGCTTTA 
TTGGAACTTG CCGAGCGGCT CGTAGAGGGT CAAGAAGTTG TCATCATTAC CGGTGCTGGA 
CTTTCGGTAG CTTCCGGTAT TCGCCCGTTT CGATCCACCA ACGGAAGTAG CGCAACTTCT 
GTTCCTACAA AACGAGGAGT TGTTCCTACA GCAGGTTTAT GGAATGATGT CATTTGGACG 
ACCGCCACCC GCGAAGCCTT TCGCAAAGAT CCGAAGCGAT GGTACAATGA CTTTTGGTTG 
CCCCACTTTC AAGACGGTAC CACCTATTAT CCCAACGCCG GCCACCTGGC GTTACAGGCC 
CTGCACGACC GTTACGAGAA TCTCCGACAA ATTACTCAAA ATATCGACGG CCTGCAAGAG 
CCCAATAATC ATCTTATCGA GGCGCATGGA CGCGTCGGTC TCTATAAATG CATTCCGCAC 
GAGGACGAAG AAAGTGACGC AATGGAAGGT GACTCGGACG ATGATGAAGA CCGAGCCGTG 
CAATTGGGAC ATCGTCGGCA AGGACGCAAG GTAAGAGAAG CATCCACAAA TCCCGAAATT 
TGTCCCTACC AATACTTGCA ATCGTTGAGT CCTTGTCAGC TGGAGCCGGC AAATGTTCGA 
AATGCCCTGT GCGAAAGCAA AGGCCAAAAC CTTCCGGAGG CTCCGGCTTG CCCAGCTTGT 
GGCGGGGACG TTTTACCGCA AGCCCTCCTT TTTGATGAAG GCTACCACGC ACACGACTTT 
TATGATTTTG AGCGAGCGGA GGCTTGGTTA GAGAGTGCGG AGGCAATCGT TTTTTGTGGA 
ACTTCGTTTG CGGTTCGCAT TACTCATGTA GCTCTGGAGC ACGCTCGAGT ACACAAGGTT 
CCTGTTTACA ATTTCAATCT ACACGATGTA CTCGAATCCA CAGCGCGATT GAATGTCACA 
AATATCATTG GGCCGTCCGA CGAAACCTTG CCCAAATTAG TGGAGGCCTG TGATGAGGCT 
GAAAGTCAGC AGGTCGGGGT AGGAGAAGGG AGTTGTTGA

Protein sequence

MPPDGNTKRQ AKQVASESKG PVEVSDDTAT RSKRPRKTSR SAGKTSASKR RRCARGAGAL 
LELAERLVEG QEVVIITGAG LSVASGIRPF RSTNGSSATS VPTKRGVVPT AGLWNDVIWT 
TATREAFRKD PKRWYNDFWL PHFQDGTTYY PNAGHLALQA LHDRYENLRQ ITQNIDGLQE 
PNNHLIEAHG RVGLYKCIPH EDEESDAMEG DSDDDEDRAV QLGHRRQGRK VREASTNPEI 
CPYQYLQSLS PCQLEPANVR NALCESKGQN LPEAPACPAC GGDVLPQALL FDEGYHAHDF 
YDFERAEAWL ESAEAIVFCG TSFAVRITHV ALEHARVHKV PVYNFNLHDV LESTARLNVT 
NIIGPSDETL PKLVEACDEA ESQQVGVGEG SC