Gene PHATRDRAFT_43744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_43744
Symbol
ID	7197265
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011670
Strand	+
Start bp	1353587
End bp	1354741
Gene Length	1155 bp
Protein Length	269 aa
Translation table
GC content	52%
IMG OID
Product	predicted protein
Protein accession	XP_002177812
Protein GI	219112121
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGAGTGTTTT TTTCACAAAC GCCAACGAAC TCTCTCGTAC ATCACACTAT CAACATCTTA 
AATTCTCTCT TTTCGCAACC ATGAGTATGC AAGTTGGGCA CCTAATTGAC GCTGCCGCTG 
ATGCGGCTGC TGGAGCTCTC ACGTCGCTCC CGAACCTTCT CAAGCGTAAA AGCGAAGAAG 
GCGCAGAGCA ATCCGAAGCC AAAATGTCCA AGACAGAAGC CCCTTAAACT GCCGATGAAG 
ACAAGGCGAA CAAACGATCC CCCATGCCAA AGGCTCGTGA AATCCGACTT GAACAGAATC 
GCAAAGCTGC TCGGGAATCG CGTCGGCGGA AGAAGGTTAT GATTGAAGAA CTTCAACGCA 
GCGTGATTTT CTTCTCGCGT GCCAACGGAA CCCTCAAACA ACAAAATGAT GAGCTGACAC 
GACTTTTAAT GCAAGCTCAG ACTCAAGTCA CGGTCTCTAG CACTGCTTCG AACAGCACTC 
TAAGTTCAGA CCAACCGAAT GATCAGTCGC ATCAAGTGAA TCGCAAGACC GAAAATGCTG 
AAAAGACGAA TAGCGAGCAA GTGCAGGCTC AAGCTGTAGC GACTCAAGCC GTCTACGAAA 
GCCAAGGATT CCCGGCTGCC GCTGCGCGTG CCGCGGCTTT AACTATGAGT GGCAATAACT 
TGGCCCCCAA TACCGCACCC GCGCCTGTCA ACACGATCCA ACAAGCACTT CCCGCAATGC 
AACCTGGTGC CACCATGCAA GCCATGGCCA ACTTTCAGCA AGCCGCTGCC GCTGCTATGC 
AGTCCGCTAT GGGACAAATG CAATCCATCC CAGGTGTCAA TATGAGTCAG CTTGCGGCTG 
CTCCCGTCGG TGCCAACGCT CAACAGGCAT ACACAGACAC CATGACGGCT TTGGCTATGC 
AGCAAGCAGC AGCCGCGGCT GCGGCGTCCG GGCAGCAGTT TGTAATGGCG GGCGGTGTTC 
CGTTTATGCA TCCCATGTTG GCTTGGCAGC AGCAAGTACA GAACCAAGCT TCGCCGCCTG 
TCATTACACA ACAACAGATG GCCGCGAATT CAACTCCAAA GCAAGACAAC TGAATTTCAT 
TCAGTGGAGG GGCCAAATGA GCTTGATCTG TGTTACTGTA TAACTACTTA TAATATCAAC 
CAATGTAAAG GTTCC

Protein sequence

MPKAREIRLE QNRKAARESR RRKKVMIEEL QRSVIFFSRA NGTLKQQNDE LTRLLMQAQT 
QVTVSSTASN STLSSDQPND QSHQVNRKTE NAEKTNSEQV QAQAVATQAV YESQGFPAAA 
ARAAALTMSG NNLAPNTAPA PVNTIQQALP AMQPGATMQA MANFQQAAAA AMQSAMGQMQ 
SIPGVNMSQL AAAPVGANAQ QAYTDTMTAL AMQQAAAAAA ASGQQFVMAG GVPFMHPMLA 
WQQQVQNQAS PPVITQQQMA ANSTPKQDN