Gene PHATRDRAFT_47890 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_47890
Symbol
ID	7203158
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011683
Strand	-
Start bp	361729
End bp	363052
Gene Length	1324 bp
Protein Length	402 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002182378
Protein GI	219124159
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGCGTGAGTC TGCTATTCTA GCATCTTTCG TAAATCTTGG ACAGACAGGC CGTCCCTCGC 
GAAGTGATTC GCCATTATTG AACAGCATGA AGCAAAATCT CTGTTATCTC GTAGTTGCGG 
TGCTGTTACC GCAGGAGATT TTGGCCTTTC TGCCAGTCGC TCATCCCTTT TTTCGACCAT 
CCTCAAGCAA TCTATTTTTA GCCCGAGAGA GAGGCGACGC GACCACAGCG AAAAGTCGCA 
AGCGATCTAA AGTAACCGAC CCAGCTGGTC CGACTCCACA ACTGGAAAGC GACGAAATTG 
AGGAAATCGA TCCCGAATCC GTGGAAGAAC TCCGTGACAT TCGGAGTCAG TCCGAACTTC 
CGCATCCAGT TCCACACCAA CCCTGGCGTC GTGGCGATAC GGCCGGTTGT GAAGCTCCTA 
TTGCGGCCGA GTGGAGACAA GAAGCAGAGG ATCTCATTAT CAAAGCTGTG GCGTTTGTCG 
GTGGTCGTGT TCTTGACGTT ACGTGGTTTC TGACACAACT AGTTGTGACA ATTGACGAAG 
AGTCCATGCC TCCCCGCGAT TTCCTGAAAG CCGAAGGCCC CGTCATCAAC GTCCAAGACC 
CATCAGTGCC GCGCTTTTAC GACCCAGATG ACCCAACTCC GGAAGATATA TGGGATGACG 
AAGAAGACTT CTTGTATCAA CGTGAGACGG AAGAGGAAGC AGCGAATGCA GAAACTCGCC 
GTAACAATTT GTATGCAACG AAGGATGCTG ACGATGACCC CGACGAGCCG CACAATCCCG 
ATATGGCGGA CGGGGATGAC GCACCGCGAC TCCGCAATGT GGAAACTAGA GACGAAGTTG 
CCTACGGGGT GGCTCTCGAA GAGGAGAACC GATTTGAAGA ATTGGAGAAG CCGATTGATT 
TAGATACTCT GCAACTAGAT AAAGCGGGGC TTTCCACTAT TGCCAATGCT ATTCTGGATG 
TCCTTGGTGA CGCTGAGGAG GAGTTGCAGA TACTTAGTCG TCACGAGCTT ATTTTGACAA 
GTCCGGGACC TGTGGATGTG TTGGAAACAC AGCGGCAGTT TGACGCGTAT CGGGATAAGG 
ACGTGATGGT GGAAACGCAA GACCCGTTCA ACTCAAATCG TACTCTTAAG GGGAAGCTTG 
TGGATCGCAA CGCCATGGAC TTGATTATCA ACAAGAAGGG ACGCATGGTG ACAATTCCTC 
TCAATTTCGT CAAGTGCGTA AGATTGCCTC CTCACGAACT TAACAAAGAG TACGACGCTG 
GAGAGATAGA AGCGTACGAA GAAGAATTAG AGTAAATCAA TTGTAAGCCT TTCTACTCTA 
TGCG

Protein sequence

MKQNLCYLVV AVLLPQEILA FLPVAHPFFR PSSSNLFLAR ERGDATTAKS RKRSKVTDPA 
GPTPQLESDE IEEIDPESVE ELRDIRSQSE LPHPVPHQPW RRGDTAGCEA PIAAEWRQEA 
EDLIIKAVAF VGGRVLDVTW FLTQLVVTID EESMPPRDFL KAEGPVINVQ DPSVPRFYDP 
DDPTPEDIWD DEEDFLYQRE TEEEAANAET RRNNLYATKD ADDDPDEPHN PDMADGDDAP 
RLRNVETRDE VAYGVALEEE NRFEELEKPI DLDTLQLDKA GLSTIANAIL DVLGDAEEEL 
QILSRHELIL TSPGPVDVLE TQRQFDAYRD KDVMVETQDP FNSNRTLKGK LVDRNAMDLI 
INKKGRMVTI PLNFVKCVRL PPHELNKEYD AGEIEAYEEE LE