Gene PHATRDRAFT_21961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_21961
Symbol
ID	7203069
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011683
Strand	+
Start bp	189348
End bp	190470
Gene Length	1123 bp
Protein Length	320 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002182172
Protein GI	219123730
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTACATTGAC AAGCTGCATT CGCTTGAGTT GCTAATCGTG GAAGAAATCG AATGTTGCGC 
ACCGGATTTG TCGAGCTCGC AAGGAACAGG AAAAAAGTCA GACAGTTTGC AATCTTGGTT 
GGGGGTGAAC AATTTAAATG AACTACGTCG AAAAGTTGAT GATATGTCTG CTACAGAACT 
CAAACAGCTT ATATTATCAA AGGTGAAGAA CTCTGCGCCT CCGTGTTCTT CGGCGTCGCC 
GCTACTCATC AAAACGGAGC AAAGCGATAC CTCGAAGCTA GTGGAAGATT TGTTAAATGA 
GCTTTCGACA GCCCCGCCTT CCAAAGAGTG GGAGATTGAT TTGTACGAAG TGCGGTTTTT 
GCGACGGATA GGACAAGGCA ACGCGGGTAC TACATACTTG GCTGACTGGA GTAACCTGAA 
AGTTGCCGTC AAAGTTGCTT CTATTTCCGA GATGGGTTTG GATGGTTGGC GCAAGGAAGT 
ACAATCCCTA CAGAAACTTC ATCATCCCAA CATTATTCGC TTACTTGGGT CGGTCTACCA 
CCCAAATCCA TTAACATTTT GTTTGGTGCT AGAGTACTGT GATGCGGGTG ATCTATCGAC 
TGCGATTCAA AAGGTAACTC CCCGTAACTT TGTTTTTCAC GTTGCGCAAA GTATTGCGAG 
GGGCATGTGC TATCTCCACA ATCGGGGGAT TATTCATCGC GATATCAAAC CAGCGAATGT 
GCTCTTGAGC GGCAAAGTTT CTTCCGGTCA ATTTGACGTC AAGGTAACAG ACTTTGGGGT 
AGCGACGGAC ACCAATTCGG TAGAAGACCG AACCGCGGAG ACAGGAACTT ATCGTTGGAT 
GGCTCCAGAA GTGATTCGTC ACGAAGCCTA TAGTCAGACT GCCGACGTCT ACTCCTTCTC 
TATACTTATG TGGCAGCTCT TGACTCGCGA AGATCCTTTC GAAGGGAAAT CTCAGATTGA 
AGCGGCAGCG GCCGTTGCCA TGGAATCTGC CCGCCCTCCG TTTCACGCCG AAACGCCTGA 
TTCGATAGTG CGGCTGATTC AAGCCTGCTG GAGCGATGAT CCACGGAAAC GCTTACCGTT 
CGACAAAATT TCCAAGACTC TGGCTAGTAT TGAATCTACA CAG

Protein sequence

MSATELKQLI LSKVKNSAPP CSSASPLLIK TEQSDTSKLV EDLLNELSTA PPSKEWEIDL 
YEVRFLRRIG QGNAGTTYLA DWSNLKVAVK VASISEMGLD GWRKEVQSLQ KLHHPNIIRL 
LGSVYHPNPL TFCLVLEYCD AGDLSTAIQK VTPRNFVFHV AQSIARGMCY LHNRGIIHRD 
IKPANVLLSG KVSSGQFDVK VTDFGVATDT NSVEDRTAET GTYRWMAPEV IRHEAYSQTA 
DVYSFSILMW QLLTREDPFE GKSQIEAAAA VAMESARPPF HAETPDSIVR LIQACWSDDP 
RKRLPFDKIS KTLASIESTQ