Gene PHATRDRAFT_9619 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_9619
Symbol
ID	7196178
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	+
Start bp	1506717
End bp	1508267
Gene Length	1551 bp
Protein Length	408 aa
Translation table
GC content	51%
IMG OID
Product	predicted protein
Protein accession	XP_002176800
Protein GI	219110097
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGGCAT CAAGTATACC GAAATCTCGC AAAGAGAAAG GTCTCCACGT CCTTTTCCTC 
TCGTCCGACA CCGGTGGAGG CCACCGCGCC AGCGCCGAGT CGCTCGCCAA TCAGTTCCAG 
CTTTTATTTC CTGGGACAAC GTACGATTTA CTCGATATTG TGGAAAAAGA CGGCGTTGCG 
CCGTATAATT CCTTGGTTTC TACATACAAG CACCTTTCGG CACATCCTTC CCAGTGGAAG 
CTGGTGTACA CGGTCTCGAA TTCCCGGGCG TTTGAAATGC TCGCCGATGC TCACCTGAAA 
CTCATGTGCG AACGTGCAGT ACGGAAACGA ATTCAGTCTT ACAATCCGGA TGTCGTTATC 
AGTGTGCATC CCCTTATGAC CAACGTGCCG GTTTTGAGTT GTTCGAAGAT ATCACACATC 
ACTGGCAAAC ACTTGCCTAT TTTTACCGTG GTAACGGATT TAGGCTCGGC GCATTGCCTG 
TGGTTCGCTA ATGGTGTGGA AAAAATGTTT GTTGGATCCG ATCAGATTAA GAAGCTCGCC 
ATGGCACGTG GTAAGGTTCC AGTGGAAAAA ATAATACTGG CTGGTTTGCC CATTCGCCAC 
GATTTCGCCA TTCAAGCCGA CCTTCTCGGA GTCCGACACT CGGAAGCAGG ACGCGCTTAT 
CAACAGCGAG TCCGCCGAGA GTTGAAACTA CCGTGTACAG ATCGTAAAAC CGTTTTGGTA 
ATGGGAGGTG GCGAAGGTGT TGGTTCATTA TCAAATATTG TCGATGCGCT GTACGTGGAG 
CTTGCCTTGC AAGGAATTGA TGCTCTGGTA TTGGTGGTCT GCGGTCGTAA TGAAAAACTG 
AGACACAAAC TAGCAACGCG AGATTGGCAG GTGGTCTTTG ATCGATGGAA CGGTGCCCTG 
GAACGGAACG GAATTTCTAG CAGTCTCATG TCCATGTCTT TCTCTGATGC CTGTGGAAAC 
GGGTTGGTAA CGAGTGGCTG TATTGAAAGC CGTGCCGGTA CCGTCACCAG TTCCATCAGG 
CGCATGTTGA GTTCCAAGAA CCTGCAAAAT GCCGTATCCA CACCGTTACC CGACTCGGAC 
CACAAACGAA CTGCGGATTC CGTTGGTGAA GAAAAGAAAT CTGAAGTAGA CCTCAACCAG 
TCTATTCCTT CAGATACCAC CATCCAATCT CCTGTACATG ATGGCTACGA AAGCAAGTCA 
CTCGGTAAAG TAATTGTGAC AGGACTCGGT TTCGTCACAC GCATGGCAGA ATACATGGTT 
GCCGCGGATG TACTAGTTTC GAAGGCTGGT CCGGGCACCA TCTCGGAAGC AGCTGCGGTG 
TCTCTTCCCG TCATGCTTAC ATCTTTTTTG CCCGGTCAAG AGGAAGGAAA TGTAGATTAT 
GTCATCGATG GCGGGTTTGG AGCGTATTGC GCCGATACCG ATCCGATTGG CATTGGCGAG 
GAAGTTTGCA TGTGGTTGCA CGACCCAGCC AAGTTGGAAA TGCTGTCCAA CGCGGCCAAA 
GCCAAGGGCG TCCCGAATGC GGCCCGGGAT ATTGCCCAGC AAATCGGCGA C

Protein sequence

MAASSIPKSR KEKGLHVLFL SSDTGGGHRA SAESLANQFQ LLFPGTTYDL LDIVEKDGVA 
PYNSLVSTYK HLSAHPSQWK LVYTVSNSRA FEMLADAHLK LMCERAVRKR IQSYNPDVVI 
SVHPLMTNVP VLSCSKISHI TGKHLPIFTV VTDLGSAHCL WFANGVEKMF VGSDQIKKLA 
MARGKVPVEK IILAGLPIRH DFAIQADLLG VRHSEAGRAY QQRVRRELKL PCTDRKTVLV 
MGGGEGVGSL SNIVDALYVE LALQGIDALV LVVCGRNEKL RHKLATRDWQ SLGKVIVTGL 
GFVTRMAEYM VAADVLVSKA GPGTISEAAA VSLPVMLTSF LPGQEEGNVD YVIDGGFGAY 
CADTDPIGIG EEVCMWLHDP AKLEMLSNAA KAKGVPNAAR DIAQQIGD