Gene PHATRDRAFT_45386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_45386
Symbol
ID	7200006
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011674
Strand	-
Start bp	1025384
End bp	1026782
Gene Length	1399 bp
Protein Length	454 aa
Translation table
GC content	46%
IMG OID
Product	predicted protein
Protein accession	XP_002179561
Protein GI	219117533
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.917332
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATAACCATGA CAACCAGAAA TGATCCCCGG AGAGAAGTGG GTAGTTGGGT CGAAACTAAG 
GCCACTGCTG TCACCTGCGA AGCCGAATGT CGTCGTAGAT ATGGTGCCTT GTGGAATTCA 
AAAATGGTGC AAGGAGTGAT TTCAGAAGTG CTGGTGACTC CAGGCTTTCG AACCAATCGG 
TCGACAACCA ACATAAAGGC ACAATATTAT CTCGGGGGAG GAACTTTCAG GGTGAAAACA 
TTGAATATTC GAAGAGTGAA ATTATTTGCG CCTTCTGCGC TTAATATCAC CAATCGCAAT 
TGTGAAATAT CAAACCTTGA CCAAGCATCG TTATCTTTGC TTCCGCGAGA GGAAGCACAC 
TCTGATTATC CCAAGGAGAC ACAAACTCCC ATTCCGTACA CTCCTATACC CCCCATACCT 
ATGGATATCC ATCCAGGATT AGCTCAAGTG ACGGGTAACA ACAATGGAGA TGAAAATACT 
GGGTTGGACT CTGAAGATCA ACCCACGGAC CGAGATGTAG CGCCCGATGC GGATGCCCAC 
GGAACATTCT GGTATAACGA CAGCAATGCA ACTAAATGTC AAATGAATGG AGAGGTCTCC 
TTCCGGCCGT GGGGTGTTAA AAATACTGTT GGTGAAATTT TTGGTCAAGG TACTGATTCA 
CGAAGATCCG TTTCTTGTCT GGATTACTTT CTAATGATGT TTCCAACTAC AACCCTCAAT 
ACAATGTCAG ATGAGACAAG TAAAGTTCTT TCTTCTATGG GTCAAAAAGA AATATCAAAT 
GGAGAGATGT TAAAGTTCTT TGGTGTATTA ATCCTTGCCA CACGCTTCGA GTTTTCGGCA 
AGGGCAAGCC TTTGGTCGAC AAGGAGCACC TCAAAGTATG TGCCGGCTCC AGCTTTTGGT 
AGGACTGGGA TGTCTCGGGA AAGATTTGAC AAAGTGTGGC AGTGCCTTCG CTGGACCAAA 
CGAGCTGATC ATTTGTCTGC TGAAATGGGG AATGAAAGCG TTCGGTGGAC TATGGTAGAT 
GGCTTTGTTC AGCAATTTAA TGCTCACCGT GAAAATCGGT TCAGACCATC TGATCTACTT 
TGCGTCGACG AATCAATATC ACGGTGGTAT GGACAGGGTG GCCATTGGAT AAATCATGGA 
CTCCCCATGT ATGTTGCAAT TGATAGAAAG CCGGAGAACG GGTGTGAGAT TCATAACACT 
GCTTGCGGTC GCAGCAGCAT CATGCTTCGG CTAAGGTTGG TAAAGACAGC AGCAGAAGAA 
GCACTTAATG GAGAGCGTCA CAGAGAAACT CTTCATGGTA CAATGATTCT CAAGTATCTT 
GTACAGCCAT GGACAATGTC TGACCGCATT GTATGTGCAG ATAGCTACTT TGCTTCAGTG 
GTTGCAGCAG AGGAATTGA

Protein sequence

MTTRNDPRRE VGSWVETKAT AVTCEAECRR RYGALWNSKM VQGVISEVLV TPGFRTNRST 
TNIKAQYYLG GGTFRVKTLN IRRVKLFAPS ALNITNRNCE ISNLDQASLS LLPREEAHSD 
YPKETQTPIP YTPIPPIPMD IHPGLAQVTG NNNGDENTGL DSEDQPTDRD VAPDADAHGT 
FWYNDSNATK CQMNGEVSFR PWGVKNTVGE IFGQGTDSRR SVSCLDYFLM MFPTTTLNTM 
SDETSKVLSS MGQKEISNGE MLKFFGVLIL ATRFEFSARA SLWSTRSTSK YVPAPAFGRT 
GMSRERFDKV WQCLRWTKRA DHLSAEMGNE SVRWTMVDGF VQQFNAHREN RFRPSDLLCV 
DESISRWYGQ GGHWINHGLP MYVAIDRKPE NGCEIHNTAC GRSSIMLRLR LVKTAAEEAL 
NGERHRETLH GTMILKYLVQ PWTMSDRIWL QQRN