Gene PHATRDRAFT_18064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_18064
Symbol
ID	7197104
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011670
Strand	-
Start bp	222291
End bp	223429
Gene Length	1139 bp
Protein Length	298 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002177887
Protein GI	219112271
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTCTGGCCGG CCAAAGAAGA AATATCGTGT GCAACTTTGA CAAAGCACTC TTTTGTCACC 
ACATCGAGAA GAATTAGAAG CTAATCCTCG GACCCGCATT TATGTTTCGA ATCGGCACAA 
CCTTGGGGAA AATTGCTGGA AATGGCGGAG CGGCTCAATG GCGCAAATGC GCTGCCATGC 
TGTCCAACTC ATTTTCAACT ACGTTGTCGG ATCTAGTGTC GACCGACATT GATATCGAGA 
CGGGTGTCGC AGTAATAACG ATGAACTACA TGCCTGTCAA CTCACTTTCA CTAGAAATGT 
AAGAATAACG GGCACGATAT CTAATGTATA CTCGTGAATT CCTCTTGTCA CTTACACTAT 
TGCAATTCAC GATTAGGTTT CAAGCGCTCT CCGCTTCCAT CAAATCCATT GAGCAGGACG 
AACGACTTCA AGCTCTCGTA CTTCAGTCGG GAAACCCTTC TATATTTTCG GCTGGCTTAG 
ATCTTCGCGA AATGGCGGAC CCCGACCCAG ATCGACTCAA CGCCTTTTGG ACGTCTTTTC 
AGCAACTGTA CTTGGATTTG TACGGTAGCC GATTGGCCAG TATCGCGGCG ATTGAAGGGC 
ACGCTCCAGC TGCTGGCTGC ATGCTTGCCC TGTCCTGTGA TTATAGAATC ATGTCGGAGA 
CTGAAGACAA ACATGCGCCA ACTATTGGGC TAAACGAAAC GCAATTTGGG ATTGTTGCTC 
CTCCTTTCTT AGCGCAACAA CTTATTGACA CGATTGGACG TCGTCCGGCA GAGCTGTCGC 
TGTCCCTCGG CACGTTGTAC AGTCCTGATG ATGCCATGGC CATTGGATTG GTGGATGAAG 
TTGTGTCCAG GGACGTAGTT CGACAGAGAG CACAAGAGAC TGCTTCTCAG TGGGCCAGGA 
TTCCATCCGT GGCCCGTGTT GCTAGTAAGA TGCTCATTCG CCAAGATGCC ATAGCCAGCC 
TCAAACAGAA CCGAGAAAAA GATTTGGAAC AGTTTGTCAG CTTCTGTCTA GATGAGCGAA 
CGCAAAAGAA TCTGCAGGCT TATCTGGTCA AACTTACCAG TAGAAAGAAA AAATGATGTT 
GCCTGAAGGC GTAATGGCGA GGGTTAGCTC AATAAACATG AAAATCCTAT CTAAAGTCT

Protein sequence

MFRIGTTLGK IAGNGGAAQW RKCAAMLSNS FSTTLSDLVS TDIDIETGVA VITMNYMPVN 
SLSLEMFQAL SASIKSIEQD ERLQALVLQS GNPSIFSAGL DLREMADPDP DRLNAFWTSF 
QQLYLDLYGS RLASIAAIEG HAPAAGCMLA LSCDYRIMSE TEDKHAPTIG LNETQFGIVA 
PPFLAQQLID TIGRRPAELS LSLGTLYSPD DAMAIGLVDE VVSRDVVRQR AQETASQWAR 
IPSVARVASK MLIRQDAIAS LKQNREKDLE QFVSFCLDER TQKNLQAYLV KLTSRKKK