Gene PHATRDRAFT_21821 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_21821
Symbol
ID	7202864
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011682
Strand	-
Start bp	443997
End bp	445371
Gene Length	1375 bp
Protein Length	311 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002182069
Protein GI	219123516
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.563947
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTTGCTGCAA CATGCAATCC TCGATCTCGG TAGGTTTCTA CGTAATTTTG TACGGGACGT 
CCCGAGGGAA ATGACCATGG CCAAATGATG TTTTCTAACA CTGTTTTGGA CTGTTTTCCT 
TGTTCAGAAA TACCGCATTA CTAAGCGGGT AGGCGGAGGA TCGTTCGGAG ATATTTATCT 
CGGAGTTGGT GCCAATGGGG AGAAGGTACG TCTCCCGTCG CTCTTTTCGA TCTAGTACGA 
AAGTACCCGC AGCCTGTCCA CGCGATTCCT CGGAATATAT GGGAGAGTAC TTACTGCACG 
GATGTATTCC GGGACAGTGC ATTTTCTAAC ACTGTTGTAA AATCGTTTTA GGTTGCTGTG 
AAGTTCGAAA AGCACGGCGC TCGATGCCCT CAGCTTCGTC ACGAATACAA AGTTTATCGC 
GAGTTGCAAA ATGCACCCGG CTTTGCTAAA GTTCACTATT TTGGTACACA GGATTCTTAT 
AATCTCATGG TTATGGATCT ACTGGGTCCT TCCCTGGAGG ATCAGTTTAA CAAGTGCGGC 
CGAAGATTTA CTCTCAAGAC TGTTCTCATG GTTGCCGATC AGATGTTGGA GCGTGTGGAG 
TTGATGCATT CACGTCACTT GATCCACCGT GACATTAAGC CAGCGAATTT CGTTACCGAT 
GCGGGGCGTG GTAACGGAAA CTTTATATAT TGTATCGATT TCGGTCTTTC GAAGCGCTAC 
CGCCATCCTC GGACGCTTCA GCACATCCCG CAGCGTGAAG GCAGATCCCT CACAGGAACG 
CCTCGGTACG CTTCGATTAA CAACCATTTA GGCGTGGAAC AATCTCGTCG GGATGACTTA 
GAGAGTATCG GGTATGTACT TGTATACTTC CTGAAGGGCG GTCTTCCATG GCAGGGACTG 
AAGGCCAAGT CCGCGACGAA AAAGTACAAG CTTATCATGG AAAAGAAGCA GTCCATCACT 
ATTCCGGCGT TGTGCCAAGG ATGTCCCAGC CAGTTTGCTG AATACTTGGC TTACTGCCGA 
TCGCTCAAAT TTGAGGCCAA GCCGAACATC GCATACTTAC GTGGTATGTT CCGTGACTTG 
TTCCGCTCGC AAGGATATAC GAACAACCAC AGTAGTCTGG ATTGGGACTG GAATCGCGTG 
GAAGGAGGCG CAGCTGCCGG CGATCGACCG GACGACAAAG CTGGGTACTG AACGGAAGCG 
CAATCATTGA CTGTGAGTAT TGAGAAACGA GGATAGCTGA GTACTCGTAT CAGATATTCA 
CGAAGCACCG TAAACCCTCT TCGCCCTCCT TTGGATTGTA TCACGTATTG ATATCAATCT 
TTAAATGTTT TAACGACACG CCAACTGTCA GTTAGCTTTT GATATTATCA AATTT

Protein sequence

MQSSISKYRI TKRVGGGSFG DIYLGVGANG EKVAVKFEKH GARCPQLRHE YKVYRELQNA 
PGFAKVHYFG TQDSYNLMVM DLLGPSLEDQ FNKCGRRFTL KTVLMVADQM LERVELMHSR 
HLIHRDIKPA NFVTDAGRGN GNFIYCIDFG LSKRYRHPRT LQHIPQREGR SLTGTPRYAS 
INNHLGVEQS RRDDLESIGY VLVYFLKGGL PWQGLKAKSA TKKYKLIMEK KQSITIPALC 
QGCPSQFAEY LAYCRSLKFE AKPNIAYLRG MFRDLFRSQG YTNNHSSLDW DWNRVEGGAA 
AGDRPDDKAG Y