Gene PHATRDRAFT_50520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_50520
Symbol
ID	7199242
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011698
Strand	+
Start bp	298480
End bp	300656
Gene Length	2177 bp
Protein Length	657 aa
Translation table
GC content	55%
IMG OID
Product	predicted protein
Protein accession	XP_002185413
Protein GI	219130523
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CCGAGTCTTT GTTGGTATCG TATCGTAGTG TACGTCCTTC CTTGCGAGTA CATGCCGGAT 
TACAGTAACA ACAACAACAA CAACAACAAC AACAACAACA ACAACAACAA CAACAATAGT 
ACCATCAGCA TCAGTAACAA CGAGTCCGCT GCCGGCAGTA CCAATCCAGT CTCGACGCCC 
CGCAAAGCGC CTCCCCACAC CACGACATTG TCTCGTGGAC GTCGTTCCGC ACGGGTGGTG 
GAGCACGATC CCGTTGTTGC TCCCGGGTAC GGCACGCGCA AAGACTTGCA CCGCTTGGCG 
GCCGATCTCT CCTCCAGAGC GGGCGTCGTA ACGGTCGCCG CGGTCGAAGC CATTATGAAG 
GCTCGCGGAC GCGGATTGCG GGGGAATAGT AACACTCCGC ATACCGACCA AGACGCTCCC 
AGCAATGCAC CGCCGGCTTC GTCGGCGTGG GCGGATTTCA TGGCGGACGA AGGCGTCAGC 
AGTAACAACA ACAACAACAC GAGCAACAAC GGTACCGGAA AAGGTCCGCG CCCGCAGTCC 
TCCACGCGGG CTTCCGGTGC CAACGCCAAC AAGACCCAGA ACGTGACCAA GTCGCCCGGA 
ACTCAACGTG ACTACGAGTT GCCCATTCTC AGTGCTTATA CTTTTCATGG TACCGCCGGC 
ACGCATGGAA ACGCTACGGA ACCCGCCAAG AAAAAAGCCA AGACTCCCAA ACAGAATACC 
CAGCAACCGG GGTACACCTT GTTGCAAGCC GGAACCCTCG ATAGTACCAT TGTCGGACGC 
GTCAAGATTA AAACACCAGA GCCCTACCAT CTGATGGTTC CCACTCGTAT CGCTATGGAT 
CGCAAGTTCA CCAAAATCTT CACGTCCTGC AATGCCGTTC ATTCCATTGC GATTGACGAA 
GCGGGCGTTG CCTACGGTTG GGGCCGGAAC GAGAGTTCCC AACTCGGAGC AAGCTTACCC 
AATGTGGTCG TCCTCCCTAC CGAACTCGAA CTGCCCGACA AGGTCGTGGG CGCCGCCCTC 
GGCAAGTCGC ACACGATTCT GCAACTCGCC GACCAGTCCC TATGGGCTGT CGGGGCCAAC 
AAGGCCGGCC AGTGTGGCGT CCGCGTGGGG ACGGAAGTCA TTCCCAACTT TCGTAAATGC 
GTCGTTCCAG AATCTGTAAC AATTGTACAG GTACGTTTTC TTTCTTGTTT GCTTCTTTGG 
TACAACCGTA TGGCGCACAA AGGTGACTCA CGCTTTTTCC GTTGGATTCT ACTCTTTATC 
ACAGATTTCC TGTGGCGAAG ATTTTTCGGT CGCTCTCGAC TCCGAGGGCT ACCTCTATTC 
GACCGGCTCT TCGGAATACG GACAACTCGG TAACGGCGAG ACGGGGGAAT ACTTCATCGC 
CGCCAACAAG CTCGGCTTTG CCAATTGCAA CGTCTTTACG AAAAGATCCG TGTTTTGTCA 
CACTCCTGGT GAAAACGCGC ATTCCAGCAA TGCGAAAGAT AAGGTCGTCC CTCTCGCAGA 
GGATGTTCGT ATTCAATCGA TTGCCTGCGG AAAACACCAC GTGGTTGCCG TCGAAGCACC 
GTCGGACCAA AAGCCTCGAG TATTCTCTTG GGGTTCCGGC GACTACGGCT GTCTCGGACA 
CGGTGTACAA GCCGACGAGT ACTTTCCCCG TATGATTGGT GGATTCATTA ACACTCCGCT 
CGGAAACAAT AAGGATGTTG TCGTTACTGC TGGTGCGCAC TGCAGCCTAA TTCGCACATC 
CAACGGACAC GTGTACTACT GGGGCAAACA CCGGCCCGTG GGCGAAGCCG TTATGAGACC 
GCAACTCGTG GATGTTCTAG CCAACAACCA GCACGATGTC AGGCACTTTG CCGCCGGAGC 
GCAAACGGTA GTGTGCAGCA CCAGTTTAGG ACAAACTGTT GCTTGGGGAC AAGGACCACA 
CGGTGAATTA GGTCTGGGGA CGCCGAAATC CAGTGCCAAA CCGAGCTTTG TCTCCGCGTT 
GGACGGCGCT CAAGTAATGG ATGTGGTCTG CGGCTACGGG CACACGTTGT ATTTGGTGCG 
GGGAGAAACA CCGGAAGACA CCAAAATTAT TGCGGGTCTC GCGGAACTCG ATCTGGATTC 
CGTGCAAGAC TTGATTGCCG GCGCGGTGGG AGTCAAGTAG GTATAAACAA TAATCAAAGA 
CGAATCGTTT TTGTAAG

Protein sequence

MPDYNNNNNN NNNNNSTISI SNNESAAGST NPVSTPRKAP PHTTTLSRGR RSARVVEHDP 
VVAPGYGTRK DLHRLAADLS SRAGVVTVAA VEAIMKARGR GLRGNSNTPH TDQDAPSNAP 
PASSAWADFM ADEGVSSNNN NNTSNNGTGK GPRPQSSTRA SGANANKTQN VTKSPGTQRD 
YELPILSAYT FHGTAGTHGN ATEPAKKKAK TPKQNTQQPG YTLLQAGTLD STIVGRVKIK 
TPEPYHLMVP TRIAMDRKFT KIFTSCNAVH SIAIDEAGVA YGWGRNESSQ LGASLPNVVV 
LPTELELPDK VVGAALGKSH TILQLADQSL WAVGANKAGQ CGVRVGTEVI PNFRKCVVPE 
SVTIVQISCG EDFSVALDSE GYLYSTGSSE YGQLGNGETG EYFIAANKLG FANCNVFTKR 
SVFCHTPGEN AHSSNAKDKV VPLAEDVRIQ SIACGKHHVV AVEAPSDQKP RVFSWGSGDY 
GCLGHGVQAD EYFPRMIGGF INTPLGNNKD VVVTAGAHCS LIRTSNGHVY YWGKHRPVGE 
AVMRPQLVDV LANNQHDVRH FAAGAQTVVC STSLGQTVAW GQGPHGELGL GTPKSSAKPS 
FVSALDGAQV MDVVCGYGHT LYLVRGETPE DTKIIAGLAE LDLDSVQDLI AGAVGVK