Gene PHATR_43850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATR_43850
Symbol
ID	7204278
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011671
Strand	+
Start bp	220871
End bp	223121
Gene Length	2251 bp
Protein Length	411 aa
Translation table
GC content	50%
IMG OID
Product	CCT motif containing protein
Protein accession	XP_002186019
Protein GI	219112871
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0351755
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

AGAATCTCGA CAGACAAACT CAAAGTATCG CACTGCGACC TCAAGGATTT GATCCCTCCA 
CAGTCATCTA CGACGCTTTC TGAATCACAG GTAAGAACGC TTCGAATGCG GTGCTTTTGG 
GCTGATTGAT TGTCATGGTC ATTCTGTATG CTGTCGTTAC GCGCGGAGTT TCGCTCCGCA 
CGAACTTCGT GTGTCTGGTT TGGAAATTCG GCGCGCTCCA CACGAACAAA GCAATTCGAG 
TCGGAACTTG ACGTTTTGTG TCGTGTGCGA TTTGAATTGG ACAGCGATTC GCGAGCGGTT 
CTGAAAAGCC AATGAATGAT GTTTCCTTCG TCATTGTGCG TCAGTGTCTG TCGGCCCTCC 
TTGAACCACG AATCTTGTGA CGGAATCTCG CCGTTGACTC TGTGTCTTAA TTGGAGTGTG 
TCATCGACCC ACTCCGGGAG AGGTCCTATA TGTATGCGGA GTGGTGAAGC AATGCGATGT 
CTGCGACAGC AAAAAGCGAC ATTTTGCGTT ATGGAAGATA GACCCGACTG ATCCCCAATC 
GTCATCCGTC AGCCAACACT TTCTCAGCCG CTCATTGGTT TGTTGATGGG GGGGGTCGGT 
CCTCTGTGCT TCTCTCGGGT CTTCGGGAAG TGTCAAATCA AACCACGCGA AATAGCGAGG 
CCTGTTTATT CTTATCGCGT CTTCAACATC AAGTTGTATA CATTTCAGTT ACTTACATTA 
CTCTGTCCAT TCACTGTCAA TGCCTTTTTC TGCAATATAC CTTGAGCAGG CTTTCTTTGA 
ACAATCCTCG GCATGATCAT GGCTAGCTCT ACGCTGACTG CCAGTCTATC CCCTGCACCA 
ACGATGGACC ACCAGGACAT GGATGCAGTG AGCGCATTGC TCGGAGTGTC ACCGTCGCGC 
ACGAACGGCT TGCTACGCGG AAGCACATGG ACATCGTCTA GTACGGTGCC AGAACCGACA 
TCACATGGGT TCTCATTCGC ACCCGCACGT ATCGTAAGCT TGGACGAGCC ATCCTCTTCG 
CCTTACATGA CTGCTTCTGG TAGTCATGAT TCGGGTCGGT CTCCTGAATC TGTGACTCTG 
CAAACAAGAC CTCGCTCCAA TTCGGCTGGA CTAGATGCTT TGGCCTTGTT GGCATCCAAG 
GAACAAGCCA AATACGAAAA CACAAAGCTC CAGAAAGAAG AGCAACCTTC CTCGTTTGAA 
AGTTTCATTC TTTCCGCTTC GCCCTCGTCT TCGAGCGACG ACGATGACTC GGAATCTATG 
CCGCCACCGG CGCCGCGCGG ACGTAGACGA AGTGCATCGA ATCCGGAGGG AATGGAGAAG 
TGGGACTCAT TGAGCGTGGG ACGCAATCAA CACAGGAACA ATTCTTGTCG TCGTCATTTT 
ATGCTACCAG ATTACGTCCT AGCTGAGGAA CTGGCAGAAG CAAGTGCCGC TATAGAAGCG 
CACGGTCGCA AACCACCGAG GACCATCCCT GAACACGCTG AATATGAAGA AGATCCAGCG 
GACAATTTTA GTATCAGCCA AGACGAGGAA ATAGAAGAGA ATTTAACGCC AGCAGAATTG 
CTTCGCCGAG CACGATCTCG GCTTTTGGAG GATTTGAGCG AGGGAAACAT TAGCGGAGAC 
AAAGGGGTTG TCACGCTACC GCATTCGCTT CCGAAATACA AGGAGGTAAG TGCCACACTG 
TTGTGTTCTC ATAAACGCGT TTTCCTCGAT ATCCCGCAAC GACTAAAGTA TTCCTTCTCA 
TACATTTCGT CAGTTTTACA ACAATGGTCG CATCGGAATC TACACACCTA ACGAACGAGC 
AGCGGTAATT GACCGATACA AGGACAAACG CTGCCGCCGC GTTTGGAATA AGAAGATTCG 
CTACGGTTGC CGTAAAAATT TAGCAGACCG CCGGTTGCGC GTGAAGGGGC GATTCGTGAA 
ACGTTGCGAA CAAGAGCAGC TTGCTAAGCT GCTAAAGCTA CAGGCGGAGG AACAGGAAAG 
CAACGTTGCG CTCAGTGAGG ACGATGTAGC TACCAATGGG GACGAAGACA TGCCAGATGT 
TAACGACCCC GAAGCTGGTT TTGATCCCAC GGACGATCAA CCTTATCGTC GTGTCCGTCG 
CCATACGATT ACCTAATTTT TGAGATGAAG AAAAGAGAAG CTATCATGCA TTTTACATAG 
CGCGCTAACC TTGAAAGCAG CGTCTTGGTA CTATTGACTC CTCTGCTAAC CTTAATAGTT 
ACTTACAATT AACTGTAAGA CTTTTTAAGT C

Protein sequence

MIMASSTLTA SLSPAPTMDH QDMDAVSALL GVSPSRTNGL LRGSTWTSSS TVPEPTSHGF 
SFAPARIVSL DEPSSSPYMT ASGSHDSGRS PESVTLQTRP RSNSAGLDAL ALLASKEQAK 
YENTKLQKEE QPSSFESFIL SASPSSSSDD DDSESMPPPA PRGRRRSASN PEGMEKWDSL 
SVGRNQHRNN SCRRHFMLPD YVLAEELAEA SAAIEAHGRK PPRTIPEHAE YEEDPADNFS 
ISQDEEIEEN LTPAELLRRA RSRLLEDLSE GNISGDKGVV TLPHSLPKYK EFYNNGRIGI 
YTPNERAAVI DRYKDKRCRR VWNKKIRYGC RKNLADRRLR VKGRFVKRCE QEQLAKLLKL 
QAEEQESNVA LSEDDVATNG DEDMPDVNDP EAGFDPTDDQ PYRRVRRHTI T