Gene PHATRDRAFT_42757 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_42757
Symbol
ID	7196134
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	+
Start bp	1004474
End bp	1005648
Gene Length	1175 bp
Protein Length	208 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002176705
Protein GI	219109904
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTCGACCCTT GCACACGTGT AGCCGAAGGA CTCAATCGCG ATCGTTACTA GTAAGAAACT 
TGCCAACAGC CACTTCGTCC TTACGAGTCG ACGTTTACAC TACAATCATG TCCGACGCCA 
ATATCAACAA TACTGCTCCC ATTAAATGGG CCCAGCGTTC CGATTCTCTC TATTTGACCA 
TTGCCTTGCC CGGTGCGTCG TCCTCGTCTA TTCCGTCCCG GTAACAACCG CGCATGTTAC 
TTGTTTACAG TCTGTGGAAT GTGTTCAGCA ATTACTGTTT TCGATAGTGT TCCATAGCGC 
TATGCCCAGT GTACAATGTG TGTATAGCCG AGCCCGCAAC TTTACTGACT CACACACAAA 
TTCCTCAATT TCCACTTTGA CCTTGTTATC GACCTTTGTG GTGCTTCCAA CTGCCAACTG 
GATGGGTCTT ATTGTGCGAC AGACGTCAAG GATGAAACAA TTAATCTCGA AGACCAGACA 
CTGAAATTCA AGGGCACATC GGGTGATAAG AGCTACGAAG TCAACATTGA ATTTTTCAAG 
AAGGTCGACG CCAAGGATTC GACCTACAAA GTTCTCCCTC GCTCGATCCA GATGCACGTG 
ATGAAGCACG AAGAGGATCG GGAGGAGTTT TGGCCCCGTC TTCTGAAAGA CAAGGCCTTG 
GAGAAAAACC AAGTCAAGAT TGATTGGGAT CGTTACGTTG ACGAAGACGA GGAGGACGAA 
GGCTTCGATA CGTCCGCTTT GGAAGGCGGT ATGGGTATGG GAGGTATGCC ACCAGGTATG 
GGTGGAATGG GAGGCATGGG AGGTATGGGT GGCATGGGAG GCGGCGCCGA TATGGAAAGC 
CTAATGAAAC AGTTGCAAAT GGGTGGCGCA GGCGGCGGTA TGGATCCTTC CATGTTTGGA 
GGAGGTGATG ATGATATGGG TGATGACGAC GATGACGAGG AAGGCGGAGA AGACGACGAT 
CTTCCGGATC TGGAAGAGGC GTAAAGATGC GGTCGAAGAA GTCTTGGGGA AGATACCACG 
GAAAAAGGTG GTTTGGCCTC GTACGGTGCC ATTGGTCTTG CGTGTATAAA GCAGCAGGAT 
AAGCGCGCTT TTTGTTGGAA TTCCCTTTCC CGCCGACAAT GAGATTTACA GATAGTATTA 
GAGTAATCAA AGGTAGAGGA AACATGCTCA TCTTG

Protein sequence

MSDANINNTA PIKWAQRSDS LYLTIALPDV KDETINLEDQ TLKFKGTSGD KSYEVNIEFF 
KKVDAKDSTY KVLPRSIQMH VMKHEEDREE FWPRLLKDKA LEKNQVKIDW DRYVDEDEED 
EGFDTSALEG GMGMGGMPPG MGGMGGMGGM GGMGGGADME SLMKQLQMGG AGGGMDPSMF 
GGGDDDMGDD DDDEEGGEDD DLPDLEEA