Gene PHATRDRAFT_14937 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_14937
Symbol
ID	7203726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011685
Strand	-
Start bp	46828
End bp	48138
Gene Length	1311 bp
Protein Length	436 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002182886
Protein GI	219125225
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.723308
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACGGTGC TAGAAGCTGG CTCCGATACG TTGTCGAAGG TGAAAATTTC AGGTGGAGGA 
CGATGCAACG TCCTGCACGA TACCGCTAAG GCTGTTCCAG AACTCCTTGC CGGCTATCCT 
CGAGGGCGTC GAGAACTCAA CGGAATCCTA CACAAGCACT TCTCGCCCAA AATGGCGCAA 
GAGTGGTTTA CCAGTCGTGG TGTAACACTC AAGACTGAGA ATGACGGTCG CATGTTTCCA 
ACCACGGATA ATTCGCAAAC TATCATCAAG GCGCTACTGG AATCTGCCGA CGATGCCAGC 
GTCTCGATCA AACATCGTGC CAAAGTTGAA GAAATAAAGA TAGATGGAAG CAAATTTGTT 
GTTGATTATC TACAAAAGAA CCAAGGTTCT GAGAAAGAGA GTTTCTCTCG GGCGTTCGAC 
GCTGTGATAC TCGCTACGGG ATCGGCACCC ATCGGCTACA AGCTAGCGTC GTCGCTTGGA 
CTTGATATGG TTCCGACTGT ACCATCTCTG TTCACTCTCA ATGCCAAGCT CGACGTCAAA 
GAAGGCGGTG TCTTGCACGG ACTCTCAGGC GTATCGGTGC CATTGGGGAA AATTTCGTAC 
CAAGTGCTTG CTCAACAACC AACCTTGGAG GTCCCCGGGG ATATCACTAT AACGACGAAT 
ACGAAAAAAT CTGTTTTGGA GCAACAAGGT CCTTTGCTGA TAACCCACCA CGGGTTGTCA 
GGGCCAGCGG CCTTGCGCTT GTCTGCATTT GGAGCCCGAG AGCTCAATGG AGCGAATTAC 
CGAGGCAAGT TGACTGTACA CTGGGCACCC TCGTTGGGAA ACGTTGACGA CGTTTTCGAA 
GCGCTGTGGA TGATCACAGG GACAAATCCC AAAAAGACTG TTTCTAGTAT ATGCCCACTG 
TTTTTGTCTG ACGGTAGTAC TGCCTTGCCG CGCCGGTTGT GGGCTTCCCT CGTCGGATGC 
TCGGGCTTCG CACTTGACCA AACCTGGGGA CAGGCTTCTA AAAAGATAAC GCGCCAGCTC 
GCTTTATTGG TAACAGCCTG TCCATTGCAG CTAACCGGAA AAGGAACATT CAAAGAAGAG 
TTCGTGACGG CAGGGGGTGT TGATTTGAAG CAGATGGACA TGAAAACCAT GCAAGTCAAG 
TCGTGCCCAG GTCTATTTGT ATGCGGTGAA CTTCTGAACG TAGATGGTGT GACCGGTGGA 
TTTAATTTTA TGAACTGTTG GGGGACTGGG TATGTAGCGG GTAGCAGTGC TGCTACATTT 
TCTGCTCAAT CTTTGCCTTC CAATCAAGAT TTTTCATTGG TTGAAGATTA G

Protein sequence

VTVLEAGSDT LSKVKISGGG RCNVLHDTAK AVPELLAGYP RGRRELNGIL HKHFSPKMAQ 
EWFTSRGVTL KTENDGRMFP TTDNSQTIIK ALLESADDAS VSIKHRAKVE EIKIDGSKFV 
VDYLQKNQGS EKESFSRAFD AVILATGSAP IGYKLASSLG LDMVPTVPSL FTLNAKLDVK 
EGGVLHGLSG VSVPLGKISY QVLAQQPTLE VPGDITITTN TKKSVLEQQG PLLITHHGLS 
GPAALRLSAF GARELNGANY RGKLTVHWAP SLGNVDDVFE ALWMITGTNP KKTVSSICPL 
FLSDGSTALP RRLWASLVGC SGFALDQTWG QASKKITRQL ALLVTACPLQ LTGKGTFKEE 
FVTAGGVDLK QMDMKTMQVK SCPGLFVCGE LLNVDGVTGG FNFMNCWGTG YVAGSSAATF 
SAQSLPSNQD FSLVED