Gene PHATRDRAFT_39921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_39921
Symbol
ID	7195707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011689
Strand	-
Start bp	368109
End bp	369662
Gene Length	1554 bp
Protein Length	517 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002183979
Protein GI	219127515
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTTTGA GAAGAAGAGA GAGGCACGTA GGCCGCAGTC CTCTTGATGG AGCTGGTCGG 
CTGCACTCGG TCCTGCTCGA TGCCGACGAG AAACGACCCC GTCGGCCGTA TTGGCGAAAG 
GCGTTACGGC AGCTTATCAT TTTTTGTCTA TCTTTGATGA TTTTTTGGGT TTTCTACAGT 
TCTTTACCAT TAGCCAGACA ATCTTCTTTA CTTGACTCGA TTGGGCGGCA ATTTCTTTCC 
GAAATGACCT GGTCGATCGT TCGACAAGAA CGTAACGCGA TTGCTGGGTT GGTTGTTCAG 
ATTGTACCGA AAGCGACAGT TTTGACCGAT TTTAAACCAA TGGCTCTACC ACTCTTGGCT 
CTGCCAATCA CCACAGACGA TGCTGAAGAC TTTGGTGCTT TAAACATAAA TTCGCTGGGT 
ACTTCAGATT GGGTTCGTTC GATTGCCGCT GACGAATATG AAAAATATGA AGCGGAACGC 
GGTTCTTGGA TGGATCACAT GGCTCAGCTG CAGCCCAATC TTCCCGACAA ACTGTTGTAC 
AACGACGACA TCGTGGGAAA GCCTACCTGT CGAAGGAACA ACTGGGCTCG CGTGTCTCAT 
CCCACATGTA ATATTTTGCA CGAAACCCGA TTCGACCAAT CCTACGAACC AACGGAACTA 
TTTCAAGAAT ACAAAGTCAA GTTTGCGGGC GATGGTGCAT ATCGGAGTGT GTGGATTCTT 
GAGCGGCCGG CCGTATCTAC GTTTGCTCTG AAACAGTTTC AGCTAGAAGA ATACGAGTTA 
GGTGTTCGTG AGCACTTTCA AGTTCAGAAA GAAGCCTCGA TCCTGGACGC GTTGTCCGAC 
AGCCCTCGTA TCATTAATAT CCACGCCCAT TGTGGAGTAT CTCTTTTCAT CGAATCAGCG 
GTTGGTACGC TAGAAGCAGA ATTGGCGTCC ACAAACGGAA CGATTGAGTT GCATGAACTC 
GGCCAGTTGC AACGATTAGA CGTGCACCCC CTGAACAATT TGACACTGGC AGAAAAGCTG 
GACCTCGCCT TAGCTATGGC AGAATCTTTG GCAGATATAC ACGGTTTTGA AGGTGGGGCA 
ATCGGCCACG GCGATATACA TCCCTCACAG TGGCTTCAAA TGGCAAATGG CGGCGTCAAA 
CTAAATGATT TCAACTCCGC CGAAATATAC GAGTACAATG TTGACGAAGG CGTCTATTGC 
AAAACTTATC ACAACTTTCC AGGAGCATTC CGAAGTCCTG AAGAAGTCCA GCATCGCCCC 
TCCAACGAAA AGATTGACGT TGTGCCTTTG GGAAACAGCA TTTACGTCCT CGTAACGGGA 
CTTTTTCCGT ACTACGAGTT GGGCGACAGT GAAAAGGAAG CAAATCGCAA GGTCAAGCAA 
GGAGTCCATC CTTACGTTGA TACGCGCTAC CGCAACCGAT CTGTCGTCGA ACGAGAACTT 
ATTGACGTCA TGGAACGTTG CTGGGAATTT GATCCAGATA GCCGAGTGTC TTCATTCGAA 
GTTGTGTCAC GATTGAGAAA TCTCAAAGCA ATGGTCGCGG AGAAGCAAAT CTAG

Protein sequence

MSLRRRERHV GRSPLDGAGR LHSVLLDADE KRPRRPYWRK ALRQLIIFCL SLMIFWVFYS 
SLPLARQSSL LDSIGRQFLS EMTWSIVRQE RNAIAGLVVQ IVPKATVLTD FKPMALPLLA 
LPITTDDAED FGALNINSLG TSDWVRSIAA DEYEKYEAER GSWMDHMAQL QPNLPDKLLY 
NDDIVGKPTC RRNNWARVSH PTCNILHETR FDQSYEPTEL FQEYKVKFAG DGAYRSVWIL 
ERPAVSTFAL KQFQLEEYEL GVREHFQVQK EASILDALSD SPRIINIHAH CGVSLFIESA 
VGTLEAELAS TNGTIELHEL GQLQRLDVHP LNNLTLAEKL DLALAMAESL ADIHGFEGGA 
IGHGDIHPSQ WLQMANGGVK LNDFNSAEIY EYNVDEGVYC KTYHNFPGAF RSPEEVQHRP 
SNEKIDVVPL GNSIYVLVTG LFPYYELGDS EKEANRKVKQ GVHPYVDTRY RNRSVVEREL 
IDVMERCWEF DPDSRVSSFE VVSRLRNLKA MVAEKQI