Gene PHATRDRAFT_43519 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_43519
Symbol
ID	7197560
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011670
Strand	+
Start bp	701657
End bp	702960
Gene Length	1304 bp
Protein Length	361 aa
Translation table
GC content	45%
IMG OID
Product	predicted protein
Protein accession	XP_002177667
Protein GI	219111831
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GATACCAATA TCAATCTCGC TGTACGAGAG TGATCAACAG GGGCTCCTGA AATTTGGTTT 
CCCGGAAACG TTGAGAGAAC AATCCCATCT TTCATCTATC GCTTGTCTGG ATGTGGATAT 
CAGCTGCAGA CTCGTCGTAT AGTAGTGAAT CTATCTAGAC ACAAGTTGTA TGCAAGAGTA 
ATGATCAGGC AATAATGATA TCGGATGATT TTACGGTTTC GTTTAATGCA CGGGATTCTA 
TTCTCTATGC TCTGTCGATT GGGTTCGGCT CCTCCTTGGA GCGATACGAT GAAGATCGGC 
GCTACGTATA CGAAGAAGAT ATCAACTTTG CAGTCGTTCC AACATTCGCG ATCACCTTTA 
CTTTTTGGGC CAATCAATAT CGGAGATCAA TTGGTGACAT TCCGCCATTT CCTCCGCCTC 
TCATGAGTTC TGCTGGTGTT TTACCCCAAG GATGCCTTCG AAATGGCGCA TCAATAGATG 
ATTTACCGAT CATTCAAACC GAAATTTCTG TCGTTTTCCA GAACGCGCTT CCTGTCCCAA 
AAAGTGGTCA AACAGAACCG ATGCGAGTAA GCCAGTCCTT TGTGTCCGTG TCTCCGAAGT 
CCATCGGCAC TTTCGTGACC ACAGAAACCA AAATTACGAA TAATTGCCAC ACTCTCTGCA 
CCATTACGTC CACGGCTCTC GTTTTGGGCG TACCAAGTAG TCATGTTAAC CCCATGCAAC 
CCACGGACAT GATTCGGGAG GAACAACACC CGTCAAAAGA TGCTCTCCAC GAGCTTTTGG 
TCGAATGGGA TTATACTGTG CCTCCCAATC AAACACTTCT ATATCGGCAG ACCAGTGGTG 
ATTCCAATGA AATTCACGTC AATCCGGATG CTCTGCCAGC CACACTAGAG AAGCAAGCTA 
GTAAAATTCG CGTAGATCCT GATTCGCAAC CTGACGTACA GAAAGAACAA GACCGTGACG 
ATTCTAGTAG GCGAAAACTT CGTTTACATG GGCTCAGCAC TCTAGGAATC GCAGTACGAG 
CTTTGATACA CTATACAGAA GACAACTACC CAGGTTCATC GCTTCAAGCT GTCAAGGCAT 
GTTTCACATA TCCTGCGTTC GTGAATGACC GTATCACTGT AAAAATTTCG GGAGCCAAGA 
ACGATTCATC CTTACAGTTA GGCAAGAGTG TATTTACTTT TCTAGTACTG AACAAGACAA 
GCGGTAAAGT CTTATTGAAA AACGGTTATG CTGAGTTTGC CTGGAACCGT TCAACCTTAC 
AGCAGCAATC AAGGCTGTAA GCCTGAGCAA TTTATACCCT AAAG

Protein sequence

MISDDFTVSF NARDSILYAL SIGFGSSLER YDEDRRYVYE EDINFAVVPT FAITFTFWAN 
QYRRSIGDIP PFPPPLMSSA GVLPQGCLRN GASIDDLPII QTEISVVFQN ALPVPKSGQT 
EPMRVSQSFV SVSPKSIGTF VTTETKITNN CHTLCTITST ALVLGVPSSH VNPMQPTDMI 
REEQHPSKDA LHELLVEWDY TVPPNQTLLY RQTSGDSNEI HVNPDALPAT LEKQASKIRV 
DPDSQPDVQK EQDRDDSSRR KLRLHGLSTL GIAVRALIHY TEDNYPGSSL QAVKACFTYP 
AFVNDRITVK ISGAKNDSSL QLGKSVFTFL VLNKTSGKVL LKNGYAEFAW NRSTLQQQSR 
L