Gene PHATRDRAFT_38995 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_38995
Symbol
ID	7194698
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011686
Strand	+
Start bp	60037
End bp	61223
Gene Length	1187 bp
Protein Length	351 aa
Translation table
GC content	46%
IMG OID
Product	predicted protein
Protein accession	XP_002183025
Protein GI	219125519
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAATGA AGCTTCAAGG TTACAAGAAG AACTACTCCA ACGTTATTCT GATGATTGTT 
TTAACGCACA CGATCGTCAA CATAATCTGG AGACGTCCAC TCAATGAGCT TAGATTTCCA 
GTCGCATCCA CATCAATAAA CACCGAAGCT GGCAGCGTCG ATATTCCAGG AACGACAATG 
AAGGCGTTGA ACGATAGACC ATGGAAGGTT GAAGGCGACT TTAACAACGA TACGACAGTA 
CTTTCAGAGA TGCGGCAAGC GCACCGATCA TGCAATGAAA CCACTATCGT CCTGACTACG 
AATTTTATTC CGACTTCTCC CTCCCTGGCG ATCATCAACC GCACTATCCA TTCGATTAGA 
AGGCTGAAAG GACTCTGTCC TACCGCACCC CTCATCATAT CTGTCGATGG TCTCAACAAG 
GAAGCTCGAA GGATTCACAA CAACTCAGAA CCGCGACTGG AAGAGTACGT CAAAAGGCTC 
CGAACCGTCT ACAACGAAAC GCATCAGAGA GTTGTGGCGA GCAATCATTC ATTGATGATT 
ACCGGAACCG TCTATCAGGC CATGGATCTA GTCAAGACGG AGTTCGTTTA TGTCATACAG 
CACGACATGC CATTTATTCA GGATATTGAC CATACTGCGC TTGTGCGGAC CTATGATCAA 
TTTCCTGCGG TGCTTCGTTT GGTGCGATTC AATTTGAGAC CCAATATTCA ACGGGGAGAT 
CTCGAAGGGA ATAATACATG CTATGCCGAA GAAACGCCCG TGAACGATGT AAATGGGATT 
TCTCTCATCA AGACATGGAT CTGGAGTGAC AAGTAAGTAT GCAATGGAGT TTCGTGGAGA 
GATGGATGAA CAAAAAGACA TACTAGTGAA GCTCTGGTAG CTACACTACG TTTGCTGTGT 
CTTTCATACA TTCCTCAAAC TTTCCGCCCT TTTTATTCTT TAGCAACCAT TTCACACGAA 
AGTCGTACTA CGACGAAATG AAAGAATTGT TCTACAAAAG ACACGGAAGG CTGCCTTTTG 
CCATGGAATG GGTGATGCGA GTTGAGGGTC AAAAGAACTG CTCTTATTGG GGGACCTTCT 
ATTACGGGCC TCAAGGGCAA GCCCCAACAA TTGCCCATAT GGATGGCCGT CAAACGACAC 
AGGTAGCGGA GAACGAAGAT TTGCGTCTGC GTCGATGGAT GCGATAA

Protein sequence

MQMKLQGYKK NYSNVILMIV LTHTIVNIIW RRPLNELRFP VASTSINTEA GSVDIPGTTM 
KALNDRPWKV EGDFNNDTTV LSEMRQAHRS CNETTIVLTT NFIPTSPSLA IINRTIHSIR 
RLKGLCPTAP LIISVDGLNK EARRIHNNSE PRLEEYVKRL RTVYNETHQR VVASNHSLMI 
TGTVYQAMDL VKTEFVYVIQ HDMPFIQDID HTALVRTYDQ FPAVLRLVRF NLRPNIQRGD 
LEGNNTCYAE ETPVNDVNGI SLIKTWIWSD NNHFTRKSYY DEMKELFYKR HGRLPFAMEW 
VMRVEGQKNC SYWGTFYYGP QGQAPTIAHM DGRQTTQVAE NEDLRLRRWM R