Gene PHATRDRAFT_25000 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_25000
Symbol
ID	7196911
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	+
Start bp	2175413
End bp	2176563
Gene Length	1151 bp
Protein Length	221 aa
Translation table
GC content	45%
IMG OID
Product	predicted protein
Protein accession	XP_002176923
Protein GI	219110343
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.19447
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGTTCATTTT GACGAAATAG GGGCGAAGTT ACGTGCTCAA ATCAACTTTG CAAATGAGCG 
ATCTTACAGT TGCTGTCTCT GAGCCTCCTG CACCGCAACA CATGGAACCG ACGGATGCCA 
ACAAAAAGCA AAAGATGTCC TATCAGATGG CAACAGACAG CGATTGGCCC GATGCATGGC 
ATATGCCGGA TGCTGTCGAA GACCAAACCA AGCCCAACCG ATTGGAGCCC AATGTCCCGG 
CAACAGTGGA CGAGCTGAAA AAGATAGGTC TCTGCTATTG GAAAATGGAC GCTGAGTCGT 
ACGAGTATCC CGTCAAGGCT GTACCATGGG TAAGATGCAC CTTTGATAGA AATATTCTGT 
GGATGGACGG CTGCTGAAAT TTCAATCAAT TTTGTCGACA TGAGACTGAC GCGATGTCCG 
TTCATTTCTA AAAAAAAACA GAATCCGGAA AACGCCACTG ATCCCAAGCT AAAGGCTCTC 
CGCGACGATC GTGGATATAG GTGAGATAGA GACTGTACGT TAGAAGAAAT TCCATCGACT 
ATACACTAAA GTTTTGGTTG CGTTTCCCAA AGTTATGCGG ATATCATTAC GATCCATCCC 
GATTACCTAC CGGTATGTTT CATGAGTCAA ACTGGGTCTG CGCACGGAAT CTCAGGATGG 
ATGAGGTGAG ACTAACTCGT ATTTTATGAA TATAGGACTT TGAGAAGAAA ATTGCAAGCT 
TCTTTGAAGA GCACATTCAT GATGCCGAGG AAATCCGATA CATTCTTGGT GGATCAGGTT 
TTTTTGACGT CCGCAACTGT AAGTACCATG TCATCGACTG TCCAATACTA CGGCTCAAAT 
GATCTCATTT TGTTCTTCTA CTCCTGCGAA TAGTGGAAGA CAAATGGATT CGGATTCATG 
TCAAAAAGGG TGATCTCATG ACACTCCCAG AGGGCATTTA TCATCGTGAG TAAAAGGTCC 
TAAACTTTCT GGTTGCTCGA CACCATTTTT GCATTCAACA ACACAGGGTG ACTCATTCCT 
CTCGTGCGTT TTGAACAGGG TTCACATGCG ACGAAGAACG CATAATTCAT GCTATGCGTC 
TTTTCATCGG AGAGCCCGTG TGGACACCAT TCAACCGTCC TCAGGAAGAC CATCCATCCC 
GAAAAAAGTA C

Protein sequence

MSDLTVAVSE PPAPQHMEPT DANKKQKMSY QMATDSDWPD AWHMPDAVED QTKPNRLEPN 
VPATVDELKK IGLCYWKMDA ESYEYPVKAV PWNPENATDP KLKALRDDRG YSYADIITIH 
PDYLPDFEKK IASFFEEHIH DAEEIRYILG GSGFFDVRNL EDKWIRIHVK KGDLMTLPEG 
IYHRFTCDEE RIIHAMRLFI GEPVWTPFNR PQEDHPSRKK Y