Gene PHATRDRAFT_50333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_50333
Symbol
ID	7199072
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011696
Strand	+
Start bp	338149
End bp	340182
Gene Length	2034 bp
Protein Length	619 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002185176
Protein GI	219130026
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GAAAAAGGAA GCACGGGAAC AAGTCATAAC AGCGTCGAAG CGTTCTTGTA CTGGATTGCA 
ACGTGAAAGC ATTGTTTCTT GACTACCCAC AAAGTGCTAG CTGGACGAAT ACAATACCAG 
GAGTAACGCG CAGGTCCTAA GACGAGGATC CTTTTCGATA CTCAATCAAT TATTATGGAC 
CCGTCTATCG GTAGTGTTCA GGATGACCCT CCGTTGTTGC ACCCTTTGGA GCATTCTCAA 
AAGGAGCGGA TCGTCAACGA CATGGACAAT GCCGTCCGCC TTGACTCGAA TAACAGCGAT 
AGAGCAGCGC AGACCTTTCA ACTTCTAGGA CGTCAATCCT CTGATGACAC CCGCCTGATA 
CGGCCGTGCC CACAACGCCA GGAGTTTTCT TCCTGCTGGG TATCGGACAC GACCACCCCC 
ATGACGAGTC GTCCTCACTT TACCCTATCA GATAGCCCGC GGCCATTGCG GCGCGTCAGA 
TCTAGATCGC TGGGAGCGTC AATCGAACAC ACCGACATCG AGTGGAGTTT AATATCGCCA 
ATGGATCGGT CGCTCATCCC GAATCAATTG AAATCGTCGA TAAAGCCGAC TATGGACCTA 
GAATTGATCA ACGCTGCAAC ACCGGAAGGG AAGAAAGAGG AAACAAGGAA AATTCAGGGC 
AAAACTACTC CCGTTTTCAT TTCCGCCATG TACGGAATGA TCAACGCCAC AATTGTATTG 
CCCGTCCTTA TGAGTTTCGG TGCCATCATT TATCGTGATC AAGCCTTTTC GCCCTACATG 
CCTGTTTTGG TTAAACTTAC AGTCGTATCA GGAGTGGTGC ATCAGCTGTG CTTTTCGACG 
TTGTCTTCGC TACCTTTCGC GGTCGGGCAG GTGCAAGACG CCGGCTTAAT TTTCTTGTCG 
AGCATGGCAT CCCACATGGT GGAGCACTGT CGCAGCCGTG GATACGACGA CGAAACACTA 
TTGGCGACCA CGACCATAGG TCTCAGTTTA TGCACAGCCC TACTGGGTTG TGGATTGGTG 
TTGATTGGAC AATTTCAACT GGCCCAGTAC GTACAACTCC TGCCAACTTC TGTTGTAGGT 
GGCTACTTAG CCTTTATTGG TTGGTTTTGC GGGATGTCCG GTGTTGGGCT CATGGCTGCT 
TCGACTGAAG TTTCGTTTGC CGTTCTTCTA GACAACTGGC AATTTGTCGT ACCGGGAATT 
GCCGGAGGCG TTGTCATTTA TGTATCGGTG CGCTATCTTC GGCATATGGC TGTTTTGCCT 
ACTTGTATTG CTGTACTTCT ACTGCTTTTT TACAGTACTT TGTGGGCCAC TACTACTTCG 
ATCGATGAGG CGGCCAAATC AGGATGGATT CGGGAAACAG ACGCCCCTCC ACCATGGTAC 
AAAACGTGGG AGTATCTGAA ACTGGACAAG GTGGCCTGGT CAGTGATTCC CGAACTAGTG 
TTAACGGAAT TGAGTATGAT CTTTGTTGTG GCGCTGTCCA GTTCATTGGA TGTGGCCGCC 
ATCGAACTGG AACTTAAAGA ACCGCTGGAC TATAATGGCG AGCTCAAGAT GGTGGGTTTG 
TCAAATCTCG TTAGCGGTCT GACGGGAGGC TACACGGGCA GCTACATCTT CAGTCAAAGT 
ATCTTTTCCT TACGGGCAGG CATTCGGTCG CGGATCGCCG GCTATGTCTT GGCTGCGTGT 
CAAGTAGTAT ATCTGCTCGT CCCCTTTCCC ATTCTGGCGT ACGTACCGAA CTTTTTCTTT 
GGGTCGCTCC TGTCAATGAT TTGTGTCGAC TTGATGTATG AATGGTTGTG GGATGTGCGG 
AACAAAGTAA CGCCCGTCGA GTACATGGTT TGTTTGGCCA CCTTTGGTCT TATTCAGGTA 
GCGGGTGTCG AGTACGGAAT TCTGCTCGGT GTCGTGGTCT TCTTATTATG TCAACGTCTT 
GGTTTCGACG TCGGAAATCA ACGGCAAAAT GCAGAGCTCG ACGAAGCCGT CGACGCTCCT 
TCTATCCCAA TCAACAGTAC CGACGGCAAC CCCCAACGCT ACGGTTCGCT GTAA

Protein sequence

MDPSIGSVQD DPPLLHPLEH SQKERIVNDM DNAVRLDSNN SDRAAQTFQL LGRQSSDDTR 
LIRPCPQRQE FSSCWVSDTT TPMTSRPHFT LSDSPRPLRR VRSRSLGASI EHTDIEWSLI 
SPMDRSLIPN QLKSSIKPTM DLELINAATP EGKKEETRKI QGKTTPVFIS AMYGMINATI 
VLPVLMSFGA IIYRDQAFSP YMPVLVKLTV VSGVVHQLCF STLSSLPFAV GQVQDAGLIF 
LSSMASHMVE HCRSRGYDDE TLLATTTIGL SLCTALLGCG LVLIGQFQLA QYVQLLPTSV 
VGGYLAFIGW FCGMSGVGLM AASTEVSFAV LLDNWQFVVP GIAGGVVIYV SVRYLRHMAV 
LPTCIAVLLL LFYSTLWATT TSIDEAAKSG WIRETDAPPP WYKTWEYLKL DKVAWSVIPE 
LVLTELSMIF VVALSSSLDV AAIELELKEP LDYNGELKMV GLSNLVSGLT GGYTGSYIFS 
QSIFSLRAGI RSRIAGYVLA ACQVVYLLVP FPILAYVPNF FFGSLLSMIC VDLMYEWLWD 
VRNKVTPVEY MVCLATFGLI QVAGVEYGIL LGVVVFLLCQ RLGFDVGNQR QNAELDEAVD 
APSIPINSTD GNPQRYGSL