Gene PHATRDRAFT_47107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_47107
Symbol
ID	7202182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011680
Strand	+
Start bp	458505
End bp	459564
Gene Length	1060 bp
Protein Length	342 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002181210
Protein GI	219121723
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0432891
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGTTTTC GGTCGGCGGT TCTGTTTCTA TTGGCTCTTC TTTCCTCCTG TGACGCCCAA 
GATCCACTTC ACCTGTCGGC AAGGCCGTGG CGAAAGTATC CAACGAGCCC CGATAGAAGC 
CACTTTTCCC GTTCGCGTCC AATTCCACAT GCGTACGGGG ACCTAAGTGC ACACTTTCTG 
GACAACGAGG AAATCAAAAC TGACCGAAGA GCACGGCGAT GGCAAGTCAA CCTGAAAACC 
AGAAATATTG GCCGGCTATC TTGGTCCAGC CGAATCATAT GGACAAACAT TGCGACCTTT 
GCTGCCCAGG CTTGGAAGCC TTCGTTTACT CAATGGGGTA TAAAAGTATC CGAGAAGATT 
TTGCGTGGCG AAGAACTGTA CAGACTTATT ACTCCAGTGT TCCTACATGG CGGCTTCGGT 
CATATTTTTA CAAATATGAT TTCGCTGAGC AGAGTCGGAC CAGATGTGGA GCGATTGTTT 
GGATCAGGAC GATTTCTGAC AACGTACATG GTTTCTGGAA TGACAGGCAA TCTTCTTTCT 
GCATATATGT CTCCCAACCC TGGTTTAGGC GCTAGCGGAG CCGTTTTTGG GGTCGTCGGC 
GCGTACTATG TTTTTTTGAC CCGCAATGAG TGGTTACTTG GACCAGCGGG ACAAAGCGTC 
ACATCTAGTA TTACACAAAC GATGCTGTTT AATATTTTCC TGGGTGCATT GAATCCAGTT 
ATTGATAATT GGGCTCATCT GGGCGGCGCT CTTGGTGGTG CGGCAATGGG CTACTACTTT 
GGACCGCGAC TTTACCTAGT AGAACTTCCA GAAGGTGGAC GTATAGTGAT GGATCGCCCA 
ATCGCTCGCC TTCCTAGAAA CATAGAATCG ATTCCCGGGA ATCTGGCGGG GCAAATCAAA 
CGAATAACAC GACGGATGCA GGTTGAAAGA TACAAGACAG AGATGCCGAC AAGGCCTTGG 
CAACAACGAC AACAACACAT GCGACAAACG GCACCAAACC GTTCAATCAA ACCTGGTCCA 
GTGGATTAAG CACAGAATGT AGTCGCATCG TTTACGTGCT

Protein sequence

MCFRSAVLFL LALLSSCDAQ DPLHLSARPW RKYPTSPDRS HFSRSRPIPH AYGDLSAHFL 
DNEEIKTDRR ARRWQVNLKT RNIGRLSWSS RIIWTNIATF AAQAWKPSFT QWGIKVSEKI 
LRGEELYRLI TPVFLHGGFG HIFTNMISLS RVGPDVERLF GSGRFLTTYM VSGMTGNLLS 
AYMSPNPGLG ASGAVFGVVG AYYVFLTRNE WLLGPAGQSV TSSITQTMLF NIFLGALNPV 
IDNWAHLGGA LGGAAMGYYF GPRLYLVELP EGGRIVMDRP IARLPRNIES IPGNLAGQIK 
RITRRMQVER YKTEMPTRPW QQRQQHMRQT APNRSIKPGP VD