Gene PHATRDRAFT_18337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_18337
Symbol
ID	7197236
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011670
Strand	+
Start bp	1197770
End bp	1200001
Gene Length	2232 bp
Protein Length	596 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002177778
Protein GI	219112053
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CAGAGCTGCT TGTGGCAGTG CGTGATCCAT CGGATTCTGT TCACAGTCAA ACATACATCC 
TGCCGAGAAG TCGTGTCCAC ACGAGCTATA TAGTATATTC CGATAACTTC ATCGTTTGCT 
GGTTGACGAT TCAAGCAAGT CTTTTACAAA ATTTCCCGTA ATTACTGAAA AGGCATTTCC 
TTGAAGTCTT GCTGCAGCAG CTGTGCCCTC ACATTGGTCA TCTCAATCAT GTGTGGAATC 
TTTGCCATTT TCTCCTCTAG CCTTCCGGAA AGCGACCTGC GACGCGAGCT GATTTCCTGT 
TCTTCGCGGT TGCGTCATCG TGGTCCGGAC TGGTCGGGTT ACAAGGTAAT CGAGGCCAAT 
GTCGAAGCTG GCATTCCGCT TTCGCACGGT ATCGCCCACG AAAGACTCGC TATTATGGAT 
CCTGAGTCCG GATCGCAACC GCTAGTTTCG CACGACGGGT CCTTAATCGT CGCCGCTAAC 
GGAGAAATCT ACAACTACAA GGAACTCTAC GAGACGCTCG AGACGCCTTA CAAGGCCAAG 
ACGGGGTCGG ACTGTGAAGT CATTTTACCT CTCTACGAGC AGTTTGGTGC ATCCATCGAA 
ATTCCTCGGT TGCTGCGAGG AATGTTTTCC TTTATCTTAT ACGATCGCCA CAATGATTCC 
TTTATGATTG TTCGTGATCA TCTCGGTATT ACACCACTCT ATATTGGATG GGCGAACGAT 
GGATCCGTGT ACGTGGCTTC CGAGATGAAA AGTTTGGTAG GGCATTGCAG CAAGTTCCAG 
AACTTTCCTC CAGGACACAT TTTCTGTAGC AAGGGAGAAC ATGCGGGCGA ATTCCAACGG 
TGGTTCAACC CATCGTGGGC TCCCGAAATG AAGCCGGGCG TCCCCCTGCC GAAGCAACCA 
TATCAAGCGG TACGTCCATA GCCTTATTGT TGAATGAAAA CTTAATGGTC TGATTTGTCT 
CACCCACATG GATTGGTCTC GTTAGGATGT TCTCCGTCAT GCATTTGAAC GTGCCGTCGT 
TCGTCGTATG ATGTCAGATG TCCCCTGGGG AGTTCTTTTG TCGGGAGGCC TTGATAGTTC 
ATTGGTGGCT GCCATTTGTG CACGCCACAT TGGTCGCCGC AGTGCATCCT TTCCCAAACT 
TCACTCGTTT ACCATAGGTT TGGAAGGTTC ACCCGACATT ATTGCCGCGA AGAAGGTCGC 
TGACTACTTG GGAACCATTC ATCACGCTTA CACGTACACC ATTCAGGAAG GTGCCGATGC 
TGTGCGAGAC GTCATCAGGG CGCTCGAAAC ATATGACCTC ACCACGGTCC GAGCGTCGAC 
GCCAATGTAT TTGATGAGCC GTAAGATCAA AGCCATGGGC ATTAAGATGG TTTTGTCTGG 
AGAAGGCGCT GACGAAGTCT TTGGTGGGTA CCTTTATTTT CACAAAGCGC CCAACGCGCA 
GGAGTTCATG GACGAGACGA TTGACAAACT CAGCCGTTTG CATATGTATG ATTGCTTGCG 
TTGCAACAAA GCAATGAGTG CTTGGGGTGT CGAACCGCGT GTACCTTTTC TAGATGCTGA 
CTTTTTGGAA GTGGCCATGA ACCTCGATCC GGAAGAAAAG ATGATCCGTC TCGGTGAAGA 
TGTTCCAAAG GAGGACCGTC GTGCCGAAAA GTGGTGTATC CGTAAGGCGT TCGACACCCC 
GGACGATCCT TACTTGCCTG ATGACATCTT GTGGCGTCAA AAGGAACAAT TTAGTGACGG 
CGTCGGCTAT GGCTGGGTTG ATCATTTGAA GGAAGTTGCG GAGCAGGAGG TGTCTGACCA 
GATGTTTGCA GCTGCAAAAA ATCGCTTTCC CCACAACACG CCTACGACCA AGGAAGGATA 
CCGCTATCGC ATGATCTTTG AGGAGATTTT CCCGGGCGAA GCGCCGGAAA AGACCGTTCC 
AGGAGGCAAA TCGATCGCTT GCTCAACTGA ACGTGCTATG CAGTGGGATG CTTCTTTCGC 
GTCTCGGGCT GATCCTAGTG GACGTTCTGC AGGAGTCCAC AGTGCAGCGT ACGACGAAGC 
CTTTGAGGCG GATACCAAAG TTAGCGAGCC CGCTATCAAG AAGGCTAAAG CGTAGGCCAA 
TACTTCGTTT CTAATCTTGG TTTGCAGTCA GGCAAGCACT GATAATCATT AAGTAATGCA 
ACGGAAAGTA TAATTTGAGA AGCATCTTTC ACCTGTCAAT AGCTAATATT TAGTATTTCC 
GTCATTTAAA TT

Protein sequence

MCGIFAIFSS SLPESDLRRE LISCSSRLRH RGPDWSGYKV IEANVEAGIP LSHGIAHERL 
AIMDPESGSQ PLVSHDGSLI VAANGEIYNY KELYETLETP YKAKTGSDCE VILPLYEQFG 
ASIEIPRLLR GMFSFILYDR HNDSFMIVRD HLGITPLYIG WANDGSVYVA SEMKSLVGHC 
SKFQNFPPGH IFCSKGEHAG EFQRWFNPSW APEMKPGVPL PKQPYQADVL RHAFERAVVR 
RMMSDVPWGV LLSGGLDSSL VAAICARHIG RRSASFPKLH SFTIGLEGSP DIIAAKKVAD 
YLGTIHHAYT YTIQEGADAV RDVIRALETY DLTTVRASTP MYLMSRKIKA MGIKMVLSGE 
GADEVFGGYL YFHKAPNAQE FMDETIDKLS RLHMYDCLRC NKAMSAWGVE PRVPFLDADF 
LEVAMNLDPE EKMIRLGEDV PKEDRRAEKW CIRKAFDTPD DPYLPDDILW RQKEQFSDGV 
GYGWVDHLKE VAEQEVSDQM FAAAKNRFPH NTPTTKEGYR YRMIFEEIFP GEAPEKTVPG 
GKSIACSTER AMQWDASFAS RADPSGRSAG VHSAAYDEAF EADTKVSEPA IKKAKA