Gene PHATRDRAFT_43359 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_43359
Symbol
ID	7197108
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011670
Strand	-
Start bp	238185
End bp	240358
Gene Length	2174 bp
Protein Length	689 aa
Translation table
GC content	51%
IMG OID
Product	predicted protein
Protein accession	XP_002177891
Protein GI	219112279
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCCAGG GATTGCCACG TACCGGCATG AACACCGGAG GGAACGTCCA AAGTGCACCG 
TCCAAGCGTT GGGTTGATTG GGGGACACCA GCAACAACAA TGGTGGTTAC GTTGCCGTTT 
CGCTTTGCTT CCAATCGACT GTTCTTTCCT GTTGTGACCA TGTTCGACCG ATCCAGTCGT 
TGCAACTATT GGTTCACGAA TTTTTGGTCG TCATTGGCTT TTCGGTCGAG TGAGTCGAAT 
CACGGGACAC CCAGGACAAC CCGGGACCGT TGCCCCGTTG GGGTGCACGA CAGACTGTGC 
CAAAGCAATC GGGACGCTTG ACGGTATCGA CCGAGTTCGT CCCGATGTTT CGGACACCAT 
GGGGAATCAC AGATCCTGAG ATCGTTTGGC GGTCCCCCAA TTACGGATTA CATTCGTATT 
CTAGGATCGT CATTGACCAT GACTGACGGG TCCAGGGAAA TAGCGCCGTC TAGTGCAGAG 
GCAATGTTGG ACACACTATA TCTATATCAA AACCCGACGA CTGGGGAAGT CTCAACGACG 
GCCCGTTGGA CGTCGCGACA ACTCTGTCGA CTACTGTGCC CCTCTACGAG TACCGCTATT 
CTACCGCAAC ATTTGACCCT CGATACACAA ATCTTGCGTT TGAATACGGA TGGCTCGTAC 
GCCAATACAG GATGGCAGGC TGCCAAAACG GCACCGATCG TACGGCAAGC CGTCGAGATT 
TGGTACTACG AACAGGACGG CGCCGTACAA GGTCCGGTTT CGAGTCGACA GCTGGCTACC 
CTCTACTACG ATTGCCCCGT AGTCTTGTAC CCCACCTCAC GTGTCTACTC GGAAAGTACA 
CCTTCCTGGA CGCCGATTCA GTCTCTTCCG TTACTGCAGC TTGCTCTGGA AGCTCTCCGG 
CCGAACGGGG TGAACTCGTT GGGGACAACC CAGGATACGC CTACCTACGA TCCTGGCTTT 
TTGGCATTTC CGTCAAACAC AAAAGTTTCT GAAAAGGAAT ACGATGAAAT TCCCAAAGAA 
GCCAAGGACG AGCTTGAAGT TTTCTTGCAA TCCACCGCCA TCATTGGGGG ATCCCGGATT 
ACCGAAGATG AAGAAGATGA AACTTACGAA AGTGACAATG GTACACGATA TGTGAAAGAT 
CCGCGCACAG GAAACTGGAT TCACGAAGCA CTCGCCCCGA AGCAGCCGCA CAAGAAAGAG 
AGCAACGAAG CAAAATCCTC TTCCCATCTC CAAACGGCAT CCGCACATCC ACCCAAAAAA 
CGCAAAAAGG CAAAATTTGC GGCCAAAAAT TCCAAGTGCT GGATTTACGT CACGGGTCTG 
CCACCCGACT GTACCGAAGA AGAGATAGCT TCGATCTTTT GCAAAGCTGG AATCATTGAC 
TTGGATCCGG AAACACAGCA ACCAAAAATA AAAATATACC TCGACCAAGC ATCAGGCTTA 
CCAAAGGGTG ATGCTTCCAT ATGTTACGCT CGCGCAGAGT CGGTAGACCT CGCTGTCACG 
CTGTTGGACG AAGCGCCCTT TCGTCCGTCG GTTCGGTCGG ATGCCTGCGT ACAATATGTC 
CTGCACGTTG AACGAGCTAA ATTTGAACAG CGTGGTCGGG TGTTTGACGA CGGTCGGCAG 
CGTGTTTCAC TCGCCAAACG CAAGGTCGCC AAACTAGCGG CGGTGCAGGC CACGGACTGG 
GACGAAGGGG AATTTAACGG CCGTCTGACG GGTGGGCGGA AGGGCTTGCG CATCGTTGTT 
CTTAAGCATT TGTTCGATCC TTCTGTACTA TCCGCAAACG AGGAAGATGG TATGCTAGCC 
GTATTGGAGC GTGATTTACG AAAGGAATGC GAGCAATGGG GTGTAGTGGA AAAGATCACC 
ATATTTTCGA AAAATTTGCA GGGCGTCGTG GTGGTCAAGT TTGCTCAGCC GGGGTCTGCT 
AGCGACGCAA TTAAGCACTT GGACGGGCTA GAATGGCCTA CTGGCTCGTC CAAGCGTCGT 
GTACATGCCA CTTTTTGGGA CGGCGTCACC GACTTTACTG TACGAAATGA AATTAAGGAG 
CAAGAAGAAG CCGAAAAACG TCAAAAAGAG TTTGGCAACT GGCTAGAAAA GCAGGAGCTA 
CCCGAAGAGC TGCGTCTAAG GATAACTGAT TAAACGAAGT ATCAGTTTTC ATTGAAATGA 
TATTGCTTTT GTCA

Protein sequence

MGQGLPRTGM NTGGNVQSAP SKRWVDWGTP ATTMVVTLPF RFASNRLFFP VVTMFDRSSR 
CNYWFTNFWS SLAFRSRQPG TVAPLGCTTD CAKAIGTLDG IDRILRSFGG PPITDYIRIL 
GSSLTMTDGS REIAPSSAEA MLDTLYLYQN PTTGEVSTTA RWTSRQLCRL LCPSTSTAIL 
PQHLTLDTQI LRLNTDGSYA NTGWQAAKTA PIVRQAVEIW YYEQDGAVQG PVSSRQLATL 
YYDCPVVLYP TSRVYSESTP SWTPIQSLPL LQLALEALRP NGVNSLGTTQ DTPTYDPGFL 
AFPSNTKVSE KEYDEIPKEA KDELEVFLQS TAIIGGSRIT EDEEDETYES DNGTRYVKDP 
RTGNWIHEAL APKQPHKKES NEAKSSSHLQ TASAHPPKKR KKAKFAAKNS KCWIYVTGLP 
PDCTEEEIAS IFCKAGIIDL DPETQQPKIK IYLDQASGLP KGDASICYAR AESVDLAVTL 
LDEAPFRPSV RSDACVQYVL HVERAKFEQR GRVFDDGRQR VSLAKRKVAK LAAVQATDWD 
EGEFNGRLTG GRKGLRIVVL KHLFDPSVLS ANEEDGMLAV LERDLRKECE QWGVVEKITI 
FSKNLQGVVV VKFAQPGSAS DAIKHLDGLE WPTGSSKRRV HATFWDGVTD FTVRNEIKEQ 
EEAEKRQKEF GNWLEKQELP EELRLRITD