Gene PHATRDRAFT_35589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_35589
Symbol
ID	7200926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011676
Strand	-
Start bp	297420
End bp	298727
Gene Length	1308 bp
Protein Length	435 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002180211
Protein GI	219118889
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.114952
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGTGT TGTGGTCTGG TTCACTCGCT AGTTTGCTCA TGGCGTCCAT TGTCAGTGCT 
CTATTCAACC GGAGTAGCAG TACCTGGCGA GCCGTTACGG AAATGGGATC CACACTCTCC 
AATCTCGGCA CATTTTCGTC ATCTTCCATC CCCGGGCCAA GAAAGCGAAC GATCAGGATT 
CTCCCCAATA CCGTGCAACA AGTTCATGTA GTAATATTGG TACACGGTTG GATGGGAAAC 
CCATCGGAAC TTGCATATCT TCAATCGACA ATGGAGCGAC AAGCGTCCAC AATAGAAGCA 
GACGACCCAG CCATAATATT TTATGTACAC AGCGCCGAAG CGAACGATGG GCGAACAAGT 
GACGGAATTG AAGCTGGTGG AAAACGACTG GCAGGCGAAG TGAATAAAAT ACTCTGCGAC 
GCAATGGAGA GTGATGCATC ACGACGCGAC GTATCGCTCT CGTTTGTCGG GAACTCCTTG 
GGTGGTTTAT ACGCACGTTA TGCGCTGAGC CAGATTGATG CTTTGCAACA GTGTAGCCTT 
TCCAACGATA AAATCTCCCA AAAGAGTTCC AGAGTCATTC CCAGAGTCTT CTGCACCACA 
GCCACACCGC ATTTGGGAGT CAGCAGATAC ACTTACCTGC CACTACCACG CGCGGCGGAG 
TACATTGTAG CCAAAGTGCT GAAACCCACT GGTTTGGATC TTTTTCGCTA CACGGAAGTA 
ATTCAAAATT TGGCGACCCA AAAAAAATTT CTGGATCCCC TCCGATCGTT TGCCAAACGA 
ATCGCCTATG CCAATGCGTA TTCAACCGAC TTCCAAGTGC CTACTGCCAC AGCTGGATTT 
TTGGCTGATA CTGACTCAAC TCATCGAAGG GTAGCTTTTC AAGAAAACTC CTCTTTCGTT 
GAGTTGATCG TCGAGACGCC AAAGTATGTG GATGATAAAT TCGATAGCGG GGGTTCGGAT 
GAGTCTCCGG CCACTTGCGA AGACCTCTCG CGTCGTTTGG ATGCTTTGGG CTGGACTAAA 
GTATTTTGCG ATGTGAGAGG GAGTCTCCCA TCGGTGCCGT TGCCTTTTCA CACTAAAGAT 
GCCTGGAGCT CGGATAGTGC GCACCGATCA AAAACGTATA CGTCCCGGGA ACTATTGGCA 
TCTTTGGCGG GTCTGGATTG GGGACGATGG CATGCTCCTT TCGGTCACAC TGTGCTCGTA 
GCGAATTCCA AGAACGACGT ATATTCCAAG TTGAATGCAG CGGGACAACC CATTATGGAT 
CAGCTCGCAT CTGATTTAAT TCAAGATATC TTACGCGAAG AGTTATAG

Protein sequence

MNVLWSGSLA SLLMASIVSA LFNRSSSTWR AVTEMGSTLS NLGTFSSSSI PGPRKRTIRI 
LPNTVQQVHV VILVHGWMGN PSELAYLQST MERQASTIEA DDPAIIFYVH SAEANDGRTS 
DGIEAGGKRL AGEVNKILCD AMESDASRRD VSLSFVGNSL GGLYARYALS QIDALQQCSL 
SNDKISQKSS RVIPRVFCTT ATPHLGVSRY TYLPLPRAAE YIVAKVLKPT GLDLFRYTEV 
IQNLATQKKF LDPLRSFAKR IAYANAYSTD FQVPTATAGF LADTDSTHRR VAFQENSSFV 
ELIVETPKYV DDKFDSGGSD ESPATCEDLS RRLDALGWTK VFCDVRGSLP SVPLPFHTKD 
AWSSDSAHRS KTYTSRELLA SLAGLDWGRW HAPFGHTVLV ANSKNDVYSK LNAAGQPIMD 
QLASDLIQDI LREEL