Gene PHATRDRAFT_31433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_31433
Symbol
ID	7196649
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	-
Start bp	87697
End bp	89869
Gene Length	2173 bp
Protein Length	641 aa
Translation table
GC content	53%
IMG OID
Product	predicted protein
Protein accession	XP_002177013
Protein GI	219110523
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00201267
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAGACG TTGAATCCGG AGACGGTACC GGGAACTACG GCAACGAAAT CGCGGACGAC 
AGTAACAATA ATAACCCTCG GGTACTGGAT CGCGACGACA GCGAGCTCGA CAAGCATGAT 
GATCCCTTTG CTCCACGCGA AGGCAAAACC CTCACCTGGA CTAACATTCA CATGACCTTG 
GTACGTGCGA ACGACGATGT AAAGGTTTTG TTGTGTATCG TTCTGCCGTA GCGCATCGTT 
GTTCGATCGT CCTCGCTCGC ATTCTCATCG TCATTGTCGT CGCCGCTATC CCCCACATAT 
AGGCTGGAAA GGGTGAGGAG TCCGAACGCA AACTTCTCGA TAACGTGTGG GGCGAGGTAC 
CGGAGAAGCA AACGACGGCG GTCATGGGTC CTTCCGGAGC CGGCAAAACG TCGCTTTTGA 
ATATTCTCGC CGGTCGCGCC AGTTCGCACG GACGCGTCAA GATCGAAAGC GACGTTCGTC 
TCAACAACTA TTCCGTCGAT CCGACCAACA TCAAGGTCCG CAAGCTGATT GCCTTTGTTG 
CGCAGGACGA TTCCTTGCAG GTCACTTCGA CGCCCCGGGA GGCCATTCGC TTTTCCGCCA 
AGTTGCGTCT ACCCAGAGCT ACGACAGATC ACCAGCTCGA CAAACTCACC GACCGCATGA 
TCACCGAACT AGGACTCACG GCCTGTGCCG ATTCCATTGT CGGAGGGGAA CTCATCAAGG 
GAATTTCCGG AGGAGAACGT AAGCGTACTT CGGTCGGGGT CGAACTCGTC GTCAAGCCTG 
CCTTGGTCTT TCTCGACGAG CCTACCAGTG GTTTGGATTC CTTCAGTGCC GTGCAGTTAT 
GTCAGGTTCT CAAAAAGGTA GCCAACGCCG GATCGTCCGT TTTCTTTACG ATCCATCAGC 
CTTCTTCGGA AATCTTCAAT TCCTTCGACC ATTTGATCCT CATGAACAAG GGACGCGTCA 
TGTACACCGG CTCGGTCCAC GGAGTGCCGG ACTTCTTTGC CTCTCGAGGA CATCCCAATC 
CTCCCAACTA CAATCCGGCC GATTTCATCA TGAACGTTGC ACAGTCGGTG CCCGTCAAGC 
AACTCAACGA GGATGGATTC TTCCCCACCG ACGAACGCAA AATGGGGGAA GCCTTTGTTC 
CGGATGACGG AAAGGATGCT CTCGGGATTA CCGTTACCCG TCGCACTGCT CGTGGTGTTG 
ACGTGTACGA CACCAAACCC CCCGGTCTCG TGACGCAGGT CAAGCTGCTC TTTACTCGTG 
AAATTAACAA CTTGCGTCGG GATGTTACGG CTCTTGGTGC CCGCTTTGGC CTCACCATCT 
TTTTGGGAGT CTTGGTTGGT ATCATCTTTT TGGATGTGGG CAAGACTGAT CCCACTGTCG 
CGGTCAATCT GCAGTCCCAC TTTGGTGCCC TCATTATGGT CCTCCTTATG AGCATGTTCG 
GGACCGCCCA ACCCGCCCTG TTGTCCTTTC CCGAAGAACG CCCCGTCTTT TTGCGCGAGT 
ATTCCACCAA TCACTATTCG GTCATTTCTT ACTTTTTATC GCGATTGACC ATGGAAGCCG 
TGGTGACTGG ACTTCAGGTA TTTGTGCAGG CCATTATCAC GTACTTTATG ATCGGCTTTC 
AACTGTCCTT TGGTTTGTTT TGGGCCGTTA CGTACTCTCT CGCCATGGCC AGTACGGCGT 
TGGCCGTGTT GCTGGGTTGT TCCGTGGAGG ATCCCAAACT AGCACAGGAA ATGTTGCCGA 
TTTTGTTTGT GCCGCAGATG CTCTTTGCCG GCTTCTTTGT CGTGCCTGAT TTGATTCGTA 
AGTGGTCGGT GTTGAGCTGT GCAAAGATGG CGGTCCCGCC CTGTCTGTAC CGACCGATTT 
TTGGAACCAC CGTGTGATGC GTTTCTCACA CGACAAATTC ATTTCTCATA TTTATGCTAC 
AGCTGTCTGG TTGCGCTGGG CTCGTTACCT TTGTACCTTG ACCTACGCCA TTCGCATTCT 
CTTGGTGGAA GAATTCTACG ATTGCGATCC TGGTAATCCA GAAGCCAACA ATGCTTGCAA 
CGACTTGGTC TCGAACATTG ACGCCGACCC GGACGAGACG TGGTGGAATT GGTTGGTGCT 
CGTAGCGCTG TTCGGGGTCG CCCGTATTTT TGCTCTCTAT ATTCTCCGTC AAAAGTCCAC 
CAAATTCTTT TAA

Protein sequence

MEDVESGDGT GNYGNEIADD SNNNNPRVLD RDDSELDKHD DPFAPREGKT LTWTNIHMTL 
AGKGEESERK LLDNVWGEVP EKQTTAVMGP SGAGKTSLLN ILAGRASSHG RVKIESDVRL 
NNYSVDPTNI KVRKLIAFVA QDDSLQVTST PREAIRFSAK LRLPRATTDH QLDKLTDRMI 
TELGLTACAD SIVGGELIKG ISGGERKRTS VGVELVVKPA LVFLDEPTSG LDSFSAVQLC 
QVLKKVANAG SSVFFTIHQP SSEIFNSFDH LILMNKGRVM YTGSVHGVPD FFASRGHPNP 
PNYNPADFIM NVAQSVPVKQ LNEDGFFPTD ERKMGEAFVP DDGKDALGIT VTRRTARGVD 
VYDTKPPGLV TQVKLLFTRE INNLRRDVTA LGARFGLTIF LGVLVGIIFL DVGKTDPTVA 
VNLQSHFGAL IMVLLMSMFG TAQPALLSFP EERPVFLREY STNHYSVISY FLSRLTMEAV 
VTGLQVFVQA IITYFMIGFQ LSFGLFWAVT YSLAMASTAL AVLLGCSVED PKLAQEMLPI 
LFVPQMLFAG FFVVPDLIPV WLRWARYLCT LTYAIRILLV EEFYDCDPGN PEANNACNDL 
VSNIDADPDE TWWNWLVLVA LFGVARIFAL YILRQKSTKF F