Gene PHATRDRAFT_15689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_15689
Symbol
ID	7195242
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011688
Strand	+
Start bp	171893
End bp	173218
Gene Length	1326 bp
Protein Length	441 aa
Translation table
GC content	56%
IMG OID
Product	predicted protein
Protein accession	XP_002183564
Protein GI	219126648
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTCGATAACG GCATACGGGT CGTGTCGCAG GAAACATACG GACAAGTCAG TACCGTCGGG 
GCCGTCGCAC AAGTCGGTAG TCGCTTCGAA CTGCCTTACG AAACCGGCAC CTGCAATCTC 
CTCGAAGTCC TCGGATTCTC CTCCACCGCG CAGCTCTCCG GCCTCGAAAT CACCAACTGC 
CTGCAAGACT GGGGCGGCAC GCCTTTTGTT AATCTCAATC GGGAGCAGTC CCTGCATTGT 
ATCGATTTAC TCCGACCCAA CGTGGAAAAA GCCGTCGCCT TGTTGGCGCA GGCGTTGCTG 
GAACCGCAAT TTCGTGCCGA AGAAATTGAA GACGCCAAAC GAGCACTCGA ATTTCAAGCC 
CTCGATATGC CTCCGGAGCT CTTGCTCGGA GAGGGCCTGC AAGTAGCCGC GTACGGAGAA 
TCGCAACAGT TGGGACAAGC CCACTTTCCG GCATCGACGG AATCGCTCAA TAATTTGTCA 
CCGGAAACGG TCGCCAACTT TTGGAGTCGT CAGTTACTCC ACAATACTCC CGGAATCGTA 
TTGGCCGGTG CCGGAGTCCG ACACGACAAA TTAGTGGAAT ACGCCGACCG ATTTTTTGGT 
CACATGCCCG GACCAACATC CAGCGCCAGC ACGACACCAT CGCCTCAGGT TGCCATTACA 
CGTTCGACCT ACCGCGGTGG ACAGGTCCGT ATACACCGCC CGTACAACCC GCAACTTGAA 
GACAAAGATC TTGTACGCAT TGCATTGGCT CTACACGTCG ACGACGGTTG GCACGGGGAC 
GACTTGGTTG GCGTCTGCGT CCTCCAAACC CTCCTCGGCG GTGGCAATTC CTTTTCCGCC 
GGTGGCCCCG GCAAGGGCAT GTACAGTCGC CTCTACCGAC AGGTACTGAA TCGGTATAAT 
TGGGCCGAAT CGGCCGAAGC CTTTACGGTC TTTTACGAAG AAGCGGGACT CTGGGGAATC 
AGTGGTTCCA CACATCCCGG TCGCGCGCGA GAAATGACCA AAGTCCTGGC CGAGCACGTA 
CTGCGACTAG CCAGCACACC CGTGACGGAC GAAGAATTGT CCCGCGCCCG GAAAATGCTC 
AAAAACAACG TCTTGACGCA ACTCGAATCG CGGTTGGTTC TATTCGAAGA TATGGGACGG 
CAGATACTGA CGTACAACAG CCGGCAAGAC ATGCACCAAG TTTGCGCCAA GATTGATGCC 
GTGACGGCGG ATGATCTGGT CCGGATTGCG CAAAATTCGT TGCGTCACCC ACCGACGCTG 
GCCAGCGTAG GAAGCAACCT TGCCTACGTA CCGCAACAAT CCGAAGTGTC GGAGTGGTTT 
CCTTAA

Protein sequence

LDNGIRVVSQ ETYGQVSTVG AVAQVGSRFE LPYETGTCNL LEVLGFSSTA QLSGLEITNC 
LQDWGGTPFV NLNREQSLHC IDLLRPNVEK AVALLAQALL EPQFRAEEIE DAKRALEFQA 
LDMPPELLLG EGLQVAAYGE SQQLGQAHFP ASTESLNNLS PETVANFWSR QLLHNTPGIV 
LAGAGVRHDK LVEYADRFFG HMPGPTSSAS TTPSPQVAIT RSTYRGGQVR IHRPYNPQLE 
DKDLVRIALA LHVDDGWHGD DLVGVCVLQT LLGGGNSFSA GGPGKGMYSR LYRQVLNRYN 
WAESAEAFTV FYEEAGLWGI SGSTHPGRAR EMTKVLAEHV LRLASTPVTD EELSRARKML 
KNNVLTQLES RLVLFEDMGR QILTYNSRQD MHQVCAKIDA VTADDLVRIA QNSLRHPPTL 
ASVGSNLAYV PQQSEVSEWF P