Gene PHATRDRAFT_21379 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_21379
Symbol
ID	7202036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011680
Strand	+
Start bp	542025
End bp	543120
Gene Length	1096 bp
Protein Length	326 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002181224
Protein GI	219121752
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CCTTGCAACA AGAGCGAACG GGAAGCAATC AGATTTTCTC AAATTCCGCT CGAGTACCTT 
TCCGCTACAG CGGATCGGGA GGAGCAACAA CACAGATCGG GGGCCTCGAG ACCCGATGGC 
CGAACGACTT GAAGAGTCGA TTCTACCAAA TGTTCTGGGA TCGGCCTGTG CCGGTATCAT 
AGCTCGCATT TCGACGCATC CACTCGATAC AACCAAAGCT CGCTTGCAGG CCCAAAGCGC 
CCCGAGGTTC CGAGGTCCTG TTGACGCTCT GGCACAGACT GCCAGAGCCG AAGGTATCAC 
CGGCTTGTAT CGAGGCTTTG GGGCAGTAAT CATCGGTGGC ACACCAGGGA CTGTTCTTTA 
CTTATGCAGT TACGATTTCG TTAAAAAAGG GCTTTCGCAA GCTTGGGAAT CACGTATGAA 
TCAACCTATG GAAGGCACGG GTGCAGATTT TGCCGTACAT TTTACGGCAG GAATGCTGGC 
AGAAACAATC GCATGCATCA TCTATGTTCC AGTGGATGTT GTGAAAGAAA GAATGCAAGT 
CCAACAGGGC TTACAAAGCT CACCATCGGC TTATAAAAGT AGCTGGGACG CTTTTCAGAA 
GATTGCAAGG TCCGAAGGCA TTACTGGAAT CTACAAGGGC TATACGGCTA CGTTGGGCTC 
GTTTGGTCCC TTTTCAGCGC TGTACTTTGT CTTTTACGAA AAATTGAAAC GCTCGAGTTG 
TCAATATGTA TCCAGAGAAC CGTATACTAT ATCTGGCTCT TCGGGAAGAA ATACGGAACT 
TCCTTTTCCT TGGGTGGTAG GTTGTAGCGC TGGTGCTGGA GCACTAGCGT CGTGGCTTAC 
ATCGCCTCTG GATATGGCAA AATTGCGGCT ACAAGTGCAA CGTGGACATA TTGCGCAAAA 
TGCTTCTTCT TTGGCTCCAG TAACGTCATA TCGAGGCGTG TGGGACTGCT TAAAGCAGGC 
ACATAAGCGC GACGGATTTC GTGGCCTTTT TCGCGGTGCT GGTGCTCGAG TTCTCCATTT 
CGCCCCTGCG ACAACGATCA CGATGACTAG CTACGAAATG TGTCGCTCTC TGTTTGCGGG 
TATAGGAGGT GCATAG

Protein sequence

MAERLEESIL PNVLGSACAG IIARISTHPL DTTKARLQAQ SAPRFRGPVD ALAQTARAEG 
ITGLYRGFGA VIIGGTPGTV LYLCSYDFVK KGLSQAWESR MNQPMEGTGA DFAVHFTAGM 
LAETIACIIY VPVDVVKERM QVQQGLQSSP SAYKSSWDAF QKIARSEGIT GIYKGYTATL 
GSFGPFSALY FVFYEKLKRS SCQYVSREPY TISGSSGRNT ELPFPWVVGC SAGAGALASW 
LTSPLDMAKL RLQVQRGHIA QNASSLAPVT SYRGVWDCLK QAHKRDGFRG LFRGAGARVL 
HFAPATTITM TSYEMCRSLF AGIGGA