Gene PHATR_46802 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATR_46802
Symbol
ID	7204550
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011679
Strand	+
Start bp	494763
End bp	496882
Gene Length	2120 bp
Protein Length	579 aa
Translation table
GC content	52%
IMG OID
Product	predicted protein
Protein accession	XP_002185717
Protein GI	219120971
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CAGGATTTCG TAAGTAGGGT CAAGGAAGAC CATGGAAACG TAGACGGAAA CACTTTTCCT 
TCGATTTTTT AGATAGTTCC ACAAGACCAT AGAAAACTTC TAGCATCCAG GAACTTATAT 
TGACCTGACG CAGACGAAAA GCGGGATCGC AATCGGTTTT GCATTTACCG CAATCAGGAG 
GAGTCCTGTG GCGTTCGGAT CAATCGCACG GCGCCAAGCT TACCGTTGTC GTTTGGGTGC 
TGGTGGCGCA CGAGGCCCCT CGTCGAATTG CACATTGACG AAACACAATG GCGAGGCAAT 
TTCGAAGAAC AAATGGTTTG CACGGTCCCC ATACGACGGG TCAGATCAGC GCATGGATTG 
CCCTGTTGGC AACCTTGGTG CAATTTTTGC TCGTCGTTTC TCCAATACTG CCGTTGGAAG 
CTTCCATCCC TGTTACAGTT GTCTTTGTGG CCCTCGTGAG TGGTTCCTTT TACTACGGAT 
ACCTTGCGCA GTTCATTGAT CCAATGGACA AGCACTTGCG TGTACATCTG CAGGAAACGG 
AACCCGAAAA CGTGGCACCG GCGGTGGCGT GTTGTGGTTG TTGTACTGTA CCGCAATTCC 
CTTCGCATCA ACACGATACC GAGCAGCCCA TGGCGAACGA AGACATGAAG CAGTGCTGGA 
TCTGCGATAC GCAGGTATCG ACGCACGCTA TGCACTGTAA ATTTTGCAAT AAATGCGTTG 
GTCGCTTTGA TCATCACTGC ATGTGTAAGT ACCACCGTGT ATCGATTTGT TTGTACCAGT 
ACATGGGCGA AGCTCGGAAG CTCACTCGAT CAACTACGAT ACTTGCTGGT CTTACAGGGC 
TCAATACGTG TATTGGGGAA GCGAATTATC TCTACTTCTT TCGGACAATG GTTTTTGTTT 
TTGTCATGGA AGTCTACCAC TTGATTGTGC AGCTTGGGCT CTTGATTGAT TCGTTCACCG 
ACGGTGCGAC GAATCAAAGG GCCACGGATT GGTTTCAAAC CGGAACGGAC ATTCCGGTGC 
ACGTGTTGCT GATTTTATTT ATTCTGTTCA ATCTGCTGTC GCTCTTTTTG ATCACGCAAT 
TGCTCCACTT CCATATCGGG CTGCGGCGCA AGCAACTAAC GACCTACCAA TTTATTGTCG 
AGGATCACAA AGGGCGACGC GAACGTGCCA AACGCGAAGG TCAATTGGAT TCCAACCGAA 
TTGTTGCCGT GACGGAGGCA CAGGAAAACG GTCAAACCTG TACCGCGTGG AAGTTGCAGT 
TGGGCGGATT GTGTCGGCAA GCGGGTTGCA CGCAGTGCGA TCCACTGGCT CTGTCACCTC 
CAGACAAGCC GGAATCGGAA TCATCCGAAG TAAACGCGCC AGAGAATTTC AGTTCCGCTT 
TGGGAGAAAG GGAAAGCGAG TCTCAGTCGG TTGTGGCAGA AACCCCTTCG ACGGAACAGC 
CTCCAAGAAT GGAGAATCGC ACCGAAAACG AGGGCGTGGC GTTTTTGAAA ATGAACGGCG 
TGGAGGATCC CGAGGAAGCA TCGTCGTCTC GGGCTTTGGA GAACGAGTCG AATTTCAGTT 
CCGCCTTGGG AGAAATGGAA AGCGAGTCTC AGTCGGATGT GGCAGAAGTC CCTTCGACGG 
AACAGCCACC AAGAATGGAG AATCGCACCG AAAACGAGGG CGTGGCGTTT TTGAAAATGA 
ACGGCGTGGA GGATCCCGAG GAAGCATCGT CGTCTCGGGC TTTGGAGAAC GAGTCGAATT 
TCAGTTCCGC GTTGGGAGAA ATGGAAAGCG AGTCTCAGTC GGATGTGGCA GAAGTCCCTT 
CGACGGAACA GCCTCCAAGA ATGGAGAATC GCACCGAAAG CGCGGGCATG GCGTTTTTGA 
AAATGAACGG CGTGGAGGAT CCCGAGGAGG CATCGTCGTC GGGGGCTCTG CCAGATGAAA 
CGATGACCGA CGGCAGCATT GAGCGAACGG AAGCTAATGT CTCAAAAGAC GTCGATGTCG 
CACCAACCAT TTCTGTTGCG GAGGAATCAG ATTTGGGTAC AAATCCTGCA ACCGGACCAA 
CCACCGATGT CGACCCGTCA GAGGACGAGG GCATCCGACA AGCTCAACAA AAAGAGCGCG 
CACAAAGGTA TTTTGCGTAG

Protein sequence

MARQFRRTNG LHGPHTTGQI SAWIALLATL VQFLLVVSPI LPLEASIPVT VVFVALVSGS 
FYYGYLAQFI DPMDKHLRVH LQETEPENVA PAVACCGCCT VPQFPSHQHD TEQPMANEDM 
KQCWICDTQV STHAMHCKFC NKCVGRFDHH CMWLNTCIGE ANYLYFFRTM VFVFVMEVYH 
LIVQLGLLID SFTDGATNQR ATDWFQTGTD IPVHVLLILF ILFNLLSLFL ITQLLHFHIG 
LRRKQLTTYQ FIVEDHKGRR ERAKREGQLD SNRIVAVTEA QENGQTCTAW KLQLGGLCRQ 
AGCTQCDPLA LSPPDKPESE SSEVNAPENF SSALGERESE SQSVVAETPS TEQPPRMENR 
TENEGVAFLK MNGVEDPEEA SSSRALENES NFSSALGEME SESQSDVAEV PSTEQPPRME 
NRTENEGVAF LKMNGVEDPE EASSSRALEN ESNFSSALGE MESESQSDVA EVPSTEQPPR 
MENRTESAGM AFLKMNGVED PEEASSSGAL PDETMTDGSI ERTEANVSKD VDVAPTISVA 
EESDLGTNPA TGPTTDVDPS EDEGIRQAQQ KERAQRYFA