Gene PHATRDRAFT_47829 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_47829
Symbol
ID	7203066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011683
Strand	-
Start bp	180912
End bp	182417
Gene Length	1506 bp
Protein Length	479 aa
Translation table
GC content	54%
IMG OID
Product	predicted protein
Protein accession	XP_002182341
Protein GI	219124082
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GACAAGCCAT TGCTTGATAT AGTCCAAAAG ACTCTCGGAA TTGGTTTCCT CTCTCTCTAT 
AAATATATGC GTGTGTTCGT TCTCTATATC GTCGTATCTA CCATGGTAGC GGACGCTTGG 
TTGACTGGTA GTCCGCAGAC TTTCCGTAGA CAATCTGTGC CACGGTCACT GGCGCCACCG 
GATTGTCCCC CCATACGACA ACGACACTGG TCCGAGACCC CCACTACGCC AACCTTTTAC 
AATATTGGCG GCGTGCGGAC ACGATTCACG ACACGATCCA TTCGTCGGCG TCCACTGACT 
CGCTGTGACG CGAAAGATCC GTCCCGCAAA CGACGGCGAA GGTCGGAAAT CGACGACGAC 
GACAGCCGTC GCAGTAACGA CGAGGACTCG TCCGAGCGAC TCGGGAGTCG AGTCAAACGC 
TTGTTTACAC GAGAACCAGC ACCGATACCG GAACCAGTAC AGCCCGAGAA GTCTTCCGGA 
GGACTGTTTC GTAATTTGTT TCCCAAGAGC GGGAACGACG TGGTTGAAAA GGAAGTCGCC 
CGACAAAACA GCAAGCGCCA GAAAACTGCC CCAAAGAAGA CAATAAGTGT TTCCAAAAGG 
GTCAGTAAAA GTCAAAGCTT GACCAAAGCT TCCAACGTGC GGCAGCGGGA ATCCAAAGAA 
TCGCAATCGA GTGTCGATGG TTTCCTAGCC GGCACTGCGG GTCGATGGCA AAGTCTCTTT 
AACTACACCG ACACGAAGAA AGCGACACCG GGGGCGGATG AAGATTCAGA CGACTCAAAA 
AAGAGCGCAA TGACTCGGAT CTTGGGCGTC TTTTCCTCTC GTAACAACAC ATCGTCATCC 
GACGAAAACG TTGTGGCGTT GGGAGGTAAG AACTCCACCA ATCCATTATC GGTTCTGCAA 
AACTACATAC AGTCCTTCAG TTTCGGTGGA GACGGAAGCG ACGGTACCGG TGGAAAATCG 
AAAGGTGCTG ACGAAGAATG GTTCGATGTT TTTCCGAAAA CCCGCATTTC CCCTGGTGAA 
ATGGTACCCG TCACCGTGGC GGGCTTGGAT TTACTCGTTA TCGCGGCCGC GGACGGACGG 
ACCTTGTACT GCCTGGCCAA TTCGTGTCCC CATTTGGGGA CGCCACTCGA GACGGGCAAA 
CTCGTGCGAT TACCCGTGGA AGAGTCCACG ACAAGTTTTA TAGAGTCGTA CTCCGAAACG 
GATGTTTCCA ACAGTAAAGG CCCCGACAGT GGCTTTTTTA CCGAACTCGA AGTCAGCTCG 
ATACTTCAGA AGGATGGTTG CGAAGATTGC ATTGTTTGCC CGTTGCACAA GACAGCATTT 
GCCCTCGGGT CGGGCCAGGT CCGGGGAGAG TGGTGTCCCT ATCCTCCCAT TCTAGGCAAG 
ATCGTAGGGG CCGTCAAGCC CCCCACCGCG GCGGCAGTCT TTGACGTCCG AACCCGCGGC 
AAAAATGTAC AAGTCCGTCT CAATACGCCG CTTCTGCAGC TCGGTCGCCC GGACCGTCAA 
CAATAA

Protein sequence

MRVFVLYIVV STMVADAWLT GSPQTFRRQS VPRSLAPPDC PPIRQRHWSE TPTTPTFYNI 
GGVRTRFTTR SIRRRPLTRC DAKDPSRKRR RRSEIDDDDS RRSNDEDSSE RLGSRVKRLF 
TREPAPIPEP VQPEKSSGGL FRNLFPKSGN DVVEKEVARQ NSKRQKTAPK KTISVSKRVS 
KSQSLTKASN VRQRESKESQ SSVDGFLAGT AGRWQSLFNY TDTKKATPGA DEDSDDSKKS 
AMTRILGVFS SRNNTSSSDE NVVALGGKNS TNPLSVLQNY IQSFSFGGDG SDGTGGKSKG 
ADEEWFDVFP KTRISPGEMV PVTVAGLDLL VIAAADGRTL YCLANSCPHL GTPLETGKLV 
RLPVEESTTS FIESYSETDV SNSKGPDSGF FTELEVSSIL QKDGCEDCIV CPLHKTAFAL 
GSGQVRGEWC PYPPILGKIV GAVKPPTAAA VFDVRTRGKN VQVRLNTPLL QLGRPDRQQ