Gene PHATRDRAFT_45751 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_45751
Symbol
ID	7200776
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011676
Strand	+
Start bp	135892
End bp	137362
Gene Length	1471 bp
Protein Length	386 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002179980
Protein GI	219118413
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0607057
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

AATGGAGCTC TTTGGTTATT CATTGCAGTC AATCCGAGTC TTCATGGCCC TTGCGTGTTT 
GGTCGACTTG GTGTTCCGAG TAGCCAATGG ACAACATGTA GAGCAGCAAT CCACTAGAAT 
GCTTGGTAGT CCTTATCTTT TCTCCAATCA AATGTCGAGG AGGAATGGAA AGAAGAAATT 
GAGGCGAGTC AACAAGAAAA TGATGCTCCG GCCGCGAAAA CAAATGCGGA AGAGACAGAA 
TATGGTGCAA CCACTAACCT TGGCCCCATC TAGTCAGCCT TTATCGGTTC CAAATCCGAC 
AGTGTCAAAG ATACCTTCCC CGCCGGCGAT GCCCTCGTTG ACGCCATCCT CAATGCCACT 
GCTGATTCCT TCGACACTGC CTTAATTCTT GCCTTCCCTA GTGCCCTCAT TGATGACTTC 
GTTGGAGCCG TCAATATCAC AAATGCCGTC AACAATGCCT TCCTTGGCGC CTTCTTCCAT 
GCCTTCGGAG ATGCCATCGT ATATGCCTTC ATTGAAACCC TCAGTATCAA CAGGGCCTTC 
GCTGGAGCCG TCAGCAGCAC CAATACCACT GGGGGTGGAT TGGATAAACC AGACAAGCGC 
AGCAGATCAT CAGTGGAGTG CTGTCACGTA TGGCAACGGA ATGTTTGTAG CAGTGGCATT 
TGGAGGCAGC GACAGTAACC TTGTAATGAC CAGCCCTAAT GGCAGGAACT GGACAAGCCA 
GAGAAGTGCA TCAGAAGCTA GTTGGTCCAG CATTACATAC GGTAATGGCA TATTTGTTGC 
GGTTGCCAAT GCTGGCAGTG ATCCTATCCG TGTCATGACC AGTCCAAATG GCATCAATTG 
GACAATGCAG GAAAGTCCTC CTGAACAAGA CAACTGGAGA AGTGTAACGT ACGGCATGGA 
TATGTTTGTT GCACTTGGTG CAGAAGAAAA TGGAGATGTC AGCAAGAAGC TTGCCATGAC 
TAGCCCAAAT GGTATGAATT GGACACTCCA GACAACAGAT CCTTTGGGGT TTTGGAACAG 
TGTTATATAC GGCGATGGAA CCTTTGTTGC GGTTGAGTTT TCTGGTGGGG TTGACAACCA 
GGTCATGACC AGCCCCAATG GAATGAATTG GACAACTCAT CCTGCCCCAG CAGCTCAATG 
GATTAGTCTG ACGTATGCCA TGGATATATT TCTGGCAGTG GCTATATTCA GCTCTGACAC 
TGAGCAGGTC ATGACCAGCC CCAACGGGAT AAACTGGACC ATCCATCAAA GCGCTAAAGA 
TGCTTGGTGG AGTAGCATTA CCTATGCAGA GGCTGAAAAT GTCTTTGCTG CAGTGGCCCG 
ATCTGGTGAG GTCATGACCA GTCCCAATGG TAGGAATTGG ACTATCCAAG AAAGTGGAGC 
AGCTGCACCA TGGAGCAGTG TCACCTATGG CAATGGAACA TTTGTGGCAG TCTCTTACAA 
TGGTGAAGTC ATGACAAGTC AGACTGGCTA G

Protein sequence

MELFGYSLQS IRVFMALACL VDLVFRVANG QHSAFIGSKS DSVKDTFPAG DALVDAILNA 
TADSFDTALI LAFPRPSLEP SAAPIPLGVD WINQTSAADH QWSAVTYGNG MFVAVAFGGS 
DSNLVMTSPN GRNWTSQRSA SEASWSSITY GNGIFVAVAN AGSDPIRVMT SPNGINWTMQ 
ESPPEQDNWR SVTYGMDMFV ALGAEENGDV SKKLAMTSPN GMNWTLQTTD PLGFWNSVIY 
GDGTFVAVEF SGGVDNQVMT SPNGMNWTTH PAPAAQWISL TYAMDIFLAV AIFSSDTEQV 
MTSPNGINWT IHQSAKDAWW SSITYAEAEN VFAAVARSGE VMTSPNGRNW TIQESGAAAP 
WSSVTYGNGT FVAVSYNGEV MTSQTG