Gene PHATRDRAFT_39901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_39901
Symbol
ID	7195533
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011689
Strand	-
Start bp	319578
End bp	320937
Gene Length	1360 bp
Protein Length	283 aa
Translation table
GC content	46%
IMG OID
Product	predicted protein
Protein accession	XP_002183968
Protein GI	219127492
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.000488323
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCAACT TTCTTGCGAT TGTTTGGCAT TTTGCTAGTC ATGGGAGCTC GTCGCTTATT 
GGCAGTGCTA GTTCAATGGA TATATTTCTG TGGTATGTTG TATCAATCTC ATTGGATGGC 
CCATGTATTT CTTCTTCAAG CACGGTCCCT ATAGCTTCCT CTCTAAAGCT CTCCCTAAAT 
ACTATTTATA TGTATTTAAA GGGACTGCGA GTGGCTTGCC TTTATTTTTG GTCTTCGTCT 
ATTTGGTGGA GTTGTTGTTG ATATGGATAC AATCTTCTGG GCCAAGACAC CAGACTACCT 
GAATGTACAG GATTACGACA CTTGTCGTGA AGCAGCGTCA ATCATCTAGT ATTCTGGGCT 
ACAAAATATG CTCCCATTTT ATGCTCGCTG CCTCGTTATT GTTTGTTTCA CAAGCGATGA 
TTCGTCAGGG TTCCTTTCTT TTAATATATG CGTACTTATA TAGAACCAAC CTATCCGTGT 
CTCGGAGGAC GGGTTTCTAA TTTTATCTTA CATTACTATG TCCACGCAAA CAATCAAACC 
ACTTCATCGA GATCCAGCGT TGTCCTTCGT GCTGCTGTCC AACAGTTAAG TCCCTGCTGT 
ATCTGTGGCA ACAAGTTTCG AGTATCACTT TGTTTGCATT CCCAAAAAGC CTGTGAGCCA 
AAAAGTGTTT TTATGTTTGG TCGATTTTCG ATTTTAAGAG AAGGGCATAA GTGTTTACTT 
GGATTTCGCG GCAAGGTCAT CCATCTTCGA ATTTTGGGAC ATTGGTGCGG CTTTTCCGTC 
GGGCCTTCGA GGCATGATGT GCTGCGGAGG TTGGCAAAAA TGTGGAACGT TAATGGGAGA 
GGTCAAAATT ACCAAGCAAC ATACTACTGA TGTATCTCCT GCTCATTTGG TCAAGTCCAT 
AGATATGCCA GCTGATCAAC TTATCAAGAC CAAACTAAGT ATTAGGTACA TCGATGCCCG 
GCGACTGGCT CAAGAGGCGG CGCAAGGTTT GGCATCCGGC GCAACTGAAG CAAACATCGT 
AGAAGAAGCG TGCGAACTTT TCGAGGACCT TGGCCACGAG GAGCAGGAGG CCATGAAAGC 
AGCCGCCGAT GCGGAGCCTG AGTGGAAGAG AAAAGCGCTT GAACAGGCTG AACGCCGAGA 
GCGAGAATGG GAGATCCAAG CAGCGCGTGA ACGGCAACAA ACGGACGGTA AAGCACAGAG 
TGCAACGATT GAGAACGACG ACGAAACTGG AGCATATGGA CCAGGTAGTG AAACAACAAC 
ATATACAACT GTCAAAAGGA CATCTACTAC AAGGGTAGTA CCAGTCGACG GGGGTCCTCA 
TCAGGTCGGA ACATCCGCCA GCTGTTGTGT TGTATTGTAG

Protein sequence

MSNFLAIVWH FASHGSSSLI GSASSMDIFL WDCEWLAFIF GLRLFGGVVV DMDTIFWAKT 
PDYLNVQDYD TCREAASSIF EFWDIGAAFP SGLRGMMCCG GWQKCGTLMG EVKITKQHTT 
DVSPAHLVKS IDMPADQLIK TKLSIRYIDA RRLAQEAAQG LASGATEANI VEEACELFED 
LGHEEQEAMK AAADAEPEWK RKALEQAERR EREWEIQAAR ERQQTDGKAQ SATIENDDET 
GAYGPGSETT TYTTVKRTST TRVVPVDGGP HQVGTSASCC VVL