Gene PHATRDRAFT_48066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_48066
Symbol	PAP-fibrillin-1
ID	7203421
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011684
Strand	+
Start bp	92243
End bp	93667
Gene Length	1425 bp
Protein Length	293 aa
Translation table
GC content	55%
IMG OID
Product	predicted protein
Protein accession	XP_002182473
Protein GI	219124360
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.743882
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGCAGTTAGG ACGACGCCCT TCCGAGGTTT TTGGACAGGA TATTCCAACA CCTTTCCAAA 
GCACACATCC TACAAAGCAT CGAATCGGCA TCCAAACACA TTTGAGGAAA TTCTACAGTC 
TTGTTGGCAT TTTCCGACTC ACACACAGAG ACCCAACGAC CGCCCTGTAT TGGCACCGTT 
CCATACAATC CGTCATGATG CGGGAACAGC GTATGCTTGC GATCCTCTGG GGCGCGGGTC 
TGTGGTTCGG TGGTAGTGGT GTCCACGCGT GGCAATTTCC CAATCTCTTT ACGGTTCCGA 
TCCAACCGGT ACGTAGATAG CACCTTCTCG CGAGAGCCAT ACGTATCGCC GACACGGGTA 
GCACCCACCC AGTTTACCTC CCTAGAGTGA CTGTACGGAC GCTTGTTCGA ATTTGTTCGA 
TCAACAGCTC TCTCTCACTC CTTTATCCCG ACAAACTCAC TCACTATTTC ATTCGCTCAA 
CACTACCACC ACCCTGGGCA TTCCTGTCTG ATGTATATCT TGTCCAGTCC CAGAAGTTTT 
CTCAAGGTTC GACTGCCAAG GTAAGTAGGT AGTCAAGGCT CCCACGTGCT GACGTTGCGG 
TCCAAACTCC TTTTCTCTAG TCCGGTGGAT ACTCACACAC CCACACCTTG CCGGGGTCTT 
TGCAGAAACA AGCCGTCCTG GACGCCGTCA GTGGCACCAA CAACGGCAAA ACCGCCACAC 
CGAATCAACA ACAAACCGTC TTGCGACGCG TCCGCGAGCT GGAGCAATCC TTTCCCCCCT 
TTCGACTCGC GGATGCCTCC CAAGCCGCCC GTTTGGACGG AATCTGGTAT TTGCAGTACA 
CCTCTCCCAG CACCGTGGGT GACAACAACA ACAACAACAA CAACAATAGC GAGGACGCCT 
GGCAACCCTC CTACGCCACC GAAGGCGACT CCCGGATTGA AACCCGGCCC TTTCAAGCAC 
GAGGGACTGT CTCGGCGGCC GGCATTCGCG TCGACACGGC CAACAAGGTC GTCCAACAAA 
TACTCGACGT CTCCAACGCC CGGGTAGCCA ACGACGTGGT GTTGGAATGG GGACGTGTCT 
ACGTGGCCGG ATCCTTTCGA CCCTCCGACA TGGTCCCCAA CCGTGCCGTC GTGTCCTTTG 
ATACCGCCGA AATTACCGTC GCCCAACAGG GCGGTACCGA AAAAGGGTGG AAAATTCAAT 
TGGGCTGGTT CTTTTGGATT CTGTCCAAAA TTCGTGGAAC CACGGAAAAC GGTTGGTTGG 
AAACCACTTT TGTCGATGAC ACGCTCCGGA TTGGGCGTGG CAACAAGGGA ACTCTCTTTG 
TTCTCACACG GGATGTCGAT GCCGTCCAAC CCTAAAACCG GTTGCCATAC GCCAAGTGCA 
AACCAGGCGC ACGCCGCGGT ATTCGCACGC TAGTACGGAA ACAGC

Protein sequence

MMREQRMLAI LWGAGLWFGG SGVHAWQFPN LFTVPIQPSQ KFSQGSTAKS GGYSHTHTLP 
GSLQKQAVLD AVSGTNNGKT ATPNQQQTVL RRVRELEQSF PPFRLADASQ AARLDGIWYL 
QYTSPSTVGD NNNNNNNNSE DAWQPSYATE GDSRIETRPF QARGTVSAAG IRVDTANKVV 
QQILDVSNAR VANDVVLEWG RVYVAGSFRP SDMVPNRAVV SFDTAEITVA QQGGTEKGWK 
IQLGWFFWIL SKIRGTTENG WLETTFVDDT LRIGRGNKGT LFVLTRDVDA VQP