Gene PHATRDRAFT_36476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_36476
Symbol
ID	7201589
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011678
Strand	-
Start bp	551376
End bp	553239
Gene Length	1864 bp
Protein Length	520 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002181026
Protein GI	219120581
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGCAGC AGAGAGATGC CTTAATGACA GCACTCAATA GTGGATTCAA GAATTTTTTT 
AAAAATGTAT CCATTCCTGA CGAGAATCGG GACCCGCTAG GACGTCCCGT ACACTACGCC 
CACGCTTGGG CCGAGTATCG TCGGCAGGCA CGGGAAATTC AACGCCGATT TGGTGGAGAG 
ACTGGGGACG TGTTAGGCTT CGGACAAGAT GATTGCGGCC AAATTGGCTA CGTCCTTTCT 
AAGGACGAAG ACAAGCCAAC AACCTACTTG CCCTTTGTCA TCAAGTCGCT CGTTCGCAAG 
GATGTTCGTC AGATTTCGGC CGGTGGTGTA CATTCGCTTG CCGTCACGGC GGACGGTGAC 
GCCTACTCAT GGGGTACTGA CGATGACGGC ACGCTTGGCC GTAAAAACGA AGCAGACACA 
GCGATTGATG CCACCACGCC GAGTCCGGTC GTCGGTTTTC GTACGGTGGA CGGAATCAAC 
GAAGATAGGC GTAAGTGAAT TTGCCGAAAC GAAACCTGCT TCGTGGGAAT GCGGCACGCA 
TCACCTCACT ACGACTTTCG TTCATCATTC AGAAATTGTT CAAGTATGCG CCGGTGCGAG 
CCATTCCCTC TTTCTATCCT ACAGTGGAAA TGTATATTCT TCAGGGTACG TTGTCTCGTA 
CTGTTTAAGC ATTCCGCCAT AATTTTTCGA TTGTGTTTGA CGCTCACAAT ACCCCAACCC 
GGCAGAATGA TGAAAGACAT GGATTCGGGT AAATTCCGTG ACATACAAAC CGTCGAAGAT 
GACCCTGCTG GCTATAATGA GAAACCGGTG CATGTGGCTC TGATGCCTAA AAAGGTCACT 
TTTATTTCCA CGACGACCGC ATTTTCTGCA GCCATTTTGG AGGATGGAAC AATGGTGACC 
TGGGGTGAGT AAAACAAAAG AAACGGTCGG TTCTATGCAA TTCAATCCTC TCTTTTCCTC 
ACGTTCTGAG ATTGCTCGAA AGGATTTGGA AACCATGGGG AGCTGGCTCG TACGGCCACC 
ATGGGCGCAA AGAAAAACAA GGAAGGAAGA CCCGATTTAG GGCAAGGCTT CTTCTACACG 
ACAAAGCAAG AAGACGGGGA CGGCAATGTC CGATTTGTGG CCACTCCTTC GTTGGTTCGT 
GAACACTTTT TGACTCCCAA GCCCCCCATC TGGTCCTTTG GGAGTCCACA AAAGAAAGTG 
ATCAATGTAG CATGTGGTTC GTATCACCTG TTGGCGGTTG CACGGGAACC TGACGATGCA 
AAGTTGCGGG TGTACTCAAG TGGCATCAAC AATTATGGCC AGTTGGGACA AGGTGACTTT 
GGAGTAGAGA CCGAGCGCCA TGAGCTCACA ATGGTACGTA AGAAATGCTT TGTTTGGTTA 
TGTGCGTAAA CAATATCTCA ATCAATTAGT GGGCTTAATC TTGAAGATTA AGGCATTGGA 
AGATGAAAAT ATAGTCAAGG TTGCATGCGG TGAATTTCAT TCCTTGGCTC TCAATCTAAT 
TGGTACGAAA GTATTCGCGT TCGGCCGTGC GGACTACGGT CAGCTCGGGA CCAAACTTTT 
CGACTTTGGT GAATGCGGGG CAACTCCCGA ACAGGTCGCC TTTCCCAGTG AGGAACGTGT 
CATAATAGCA GATATTGATG CTGGAAGTTC TCACTCGATG GCGATTACCA TCGATGACGA 
AGTGTATTCT TGGGGCTTCG GAGATGGCAA CACTGGATTT GGCGATGTTC AAAGTGATGT 
TGTATATCCA CGAAAGCTAA CACTCACGGC CAAGCAAATC AATGCCAAGG GCCGAGTTCT 
TGCCACCAGC GGTGGTGGAC AGCATGGGCT TATGCTAGTC AAGCGATACG CATTTCAGAC 
GTAA

Protein sequence

MKQQRDALMT ALNSGFKNFF KNVSIPDENR DPLGRPVHYA HAWAEYRRQA REIQRRFGGE 
TGDVLGFGQD DCGQIGYVLS KDEDKPTTYL PFVIKSLVRK DVRQISAGGV HSLAVTADGD 
AYSWGTDDDG TLGRKNEADT AIDATTPSPV VGFRTVDGIN EDRQIVQVCA GASHSLFLSY 
SGNVYSSGMM KDMDSGKFRD IQTVEDDPAG YNEKPVHVAL MPKKVTFIST TTAFSAAILE 
DGTMVTWDCS KGFGNHGELA RTATMGAKKN KEGRPDLGQG FFYTTKQEDG DGNVRFVATP 
SLVREHFLTP KPPIWSFGSP QKKVINVACG SYHLLAVARE PDDAKLRVYS SGINNYGQLG 
QGDFGVETER HELTMIKALE DENIVKVACG EFHSLALNLI GTKVFAFGRA DYGQLGTKLF 
DFGECGATPE QVAFPSEERV IIADIDAGSS HSMAITIDDE VYSWGFGDGN TGFGDVQSDV 
VYPRKLTLTA KQINAKGRVL ATSGGGQHGL MLVKRYAFQT