Gene PHATRDRAFT_35099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_35099
Symbol
ID	7200524
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011675
Strand	-
Start bp	55917
End bp	57155
Gene Length	1239 bp
Protein Length	412 aa
Translation table
GC content	60%
IMG OID
Product	predicted protein
Protein accession	XP_002179783
Protein GI	219117998
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTACTCT TCCAACACCG GTCCCAACCT TCACGACCCA CCCTGGCCGT GTGTGTTCGT 
GACCCTTCCC TCACTTCCGT TACCAGCCAG GATTCCGAGA TTGACAGTAC CACGCCGGCC 
CACGGTACGC GTCGCCGCCA CGCACTCGTC CGCTGGCGGA GCCGTCGCGA GATCTCCACG 
GTCGCCTCCA CTGCTCCCCA CCACCCCAAT CTACCCCGAC CACACGGTCC CACACTCCGT 
CCTTTGGAAC GTTCACGGTC ACTCGCGAGC ATCATCAAAC CCGCTTCCGT CCGTTCCCTC 
GTACAACGTC CGTCTCCGGA TCGTCACGCC GTATACCGGG AACTCGGGAT GGGTCCCTTA 
CGGTTTGCTC CCGCTCCCGA CGTACCGTCC ACGTCACTGC ATGATCTCAC CGTCCCGCAA 
CGTCTCGTCG TGCGGATCTT GTGGGAACAG TGGCGGGACC GGAATCCTGC CGACGTATCG 
GCCGAATGGG AACACTGGTG TTTGTGCTTT GCCCGGTGCA GTCCGGGAGC AGCCAATTTT 
GATTCCCGGA ACGCCTGGAA AGTCATGAAG CATTTCGATA AGCGTTACGT CAATCTCAAA 
GCCGTCACGC TGGAATCGCG GTTGGCCGCC AAGACCGTCG TTCCCGTTCC GGGCCTACGC 
ACACACCAGG GTTTGGACGT TGTCTACGTA CGCCCGTCAC GCTTCCATCC CAAAACGGAC 
AACGTCCCCG CGATTCTTGA TCCTCTCGTG TACGTGCTCA TGAACATGAC CGTCACCCAC 
GAATCCGCGT CGACCAACGG CCTTTGCATA GTCCTCAACA TGGAACAGTG GACCATGCGG 
CATTATACGA CCGATTTTCT CCGACGCTTT TGGGCCGTTT TTCAGGGCTT CAGGGCTCCC 
GTCCGGGTTC GTCAAGTCCT GATCGTCGAC CCACCATCCT GGTTTGCGAC TATTGGGAGA 
CTCATGACGT CGTCCATGAT GACTGACGAC TTTGCCGCAC GCGTACACCG GACGCCGTCC 
GCCGCGCTCG GCCAATACCT GGCTGACGGC TATACGCAAC ACTTGCCGGA CGATATGGTG 
GGCGGCAGCG TTCCCACCGC CGACCTGGTA CGGGACTATC TCGCGTTCCG CAAATACGTC 
GAAGCCGTTG AAGAAGTCCC ACCGTCGACG CGGCCTCCGC TGACCCGTGG TTTCCAGTCG 
GAACGCCGCG TTCGCTTCGA ATTTCCTACT TTCAAATAG

Protein sequence

MVLFQHRSQP SRPTLAVCVR DPSLTSVTSQ DSEIDSTTPA HGTRRRHALV RWRSRREIST 
VASTAPHHPN LPRPHGPTLR PLERSRSLAS IIKPASVRSL VQRPSPDRHA VYRELGMGPL 
RFAPAPDVPS TSLHDLTVPQ RLVVRILWEQ WRDRNPADVS AEWEHWCLCF ARCSPGAANF 
DSRNAWKVMK HFDKRYVNLK AVTLESRLAA KTVVPVPGLR THQGLDVVYV RPSRFHPKTD 
NVPAILDPLV YVLMNMTVTH ESASTNGLCI VLNMEQWTMR HYTTDFLRRF WAVFQGFRAP 
VRVRQVLIVD PPSWFATIGR LMTSSMMTDD FAARVHRTPS AALGQYLADG YTQHLPDDMV 
GGSVPTADLV RDYLAFRKYV EAVEEVPPST RPPLTRGFQS ERRVRFEFPT FK