Gene PHATRDRAFT_47240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_47240
Symbol
ID	7202618
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011681
Strand	+
Start bp	585
End bp	2368
Gene Length	1784 bp
Protein Length	544 aa
Translation table
GC content	51%
IMG OID
Product	predicted protein
Protein accession	XP_002181466
Protein GI	219122259
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCAAA TTGCAGTCGG CATCAAAGCG TTTTTCTTGG TCTCTCTTTG CTCCGGAGCG 
ACCGCATCTT CCAAAAACCG TGATCTTCAA GAATTTATTG CCATTGCATC TTACCAGCCA 
AGAACAGATG TCTCGAACCA GGTAGGTATC AAGAAGGAAT TATGTCTCCT GAAGCAAGTA 
TTTAATGTTG TTGCTCAACT CCTTTTTCAC TTTAAAGAAA AACATAGCTT TGGATCAGTA 
TGAATTATCG AGCTTTCTCG GAAACCCAGC GAACGATGAT CTCGAGGCGG CCAAAGCAAT 
TTACGAAAGA GGAGCGTTTG TCACTCCGAT CGCGCGCCTT ACTTTGACGA ACGAAAGTGG 
TCTTCCCACT ATGATTACTT CAGACGAGAC ACTCGTAACA GGAAAGACTG CAAACGGCAC 
AGAAGTAACT GGAATCGCGT ACGAATCGTT CAACCCAGGA GAAATGGAAA TTTCGGTCCA 
GTACGCCAGC GATGCGCCAG ATAGCTGCGA AGTCGGTGGG CTCCTAGAAC CGTACATGCA 
CGGATGCTTT GCAGCTGATG GTGAGCTGGA CATAGAAGGA GAGCGTGTTG CTTACAGATA 
CGACCCCTCG ACCGATAATT ACAACGGGAG GACTTTGCAA CAATTCAGCA CTGGTGCATC 
TTTTACATTC CGCGATCCTA ATGCGGGTAC CGAGTACTTT GATGAATTCG AAAAGTTCTT 
CGACTACTAT GGGAAAGCCT CCTACGCCGA TATTTTGATT CAAGCCGCTT TCAATAAGAC 
AAATACCGGC TTTCGAAATG GAAACTTGGA TTTTTCGACT TATCTTGACG GTGACGGACA 
AAATGGTGAG TTCAGCTTTT TAGGCGTCGG CCTCCCCGAA TGTTGCTTTC GTGGCTGACC 
ATGACCTTTT GGACACAGCG GCCATCGCCA CGGCGACGGC TTACATGATT TTAGGAATGG 
AAATAATTGG CAAGTTGGAG CATGCTGTGG TGCAATGTGA CCTTCCCTGT GAGACTGACG 
ACTGCAAGCT TGACCCCGTG CATAGTCTCG ACGAAGCCGT CGCATTTTGG ACCGGAGTGT 
TGGAAGACTT TGATCAGGGT TCGGGGCGCA GCAACCTGTT GTACGGATTG GCTGACGAAA 
CCTGTCGCCA GTTTCGCACT TGTGGAGTGA CCGGAGATTC AACGGAAGGC ACGTCGCGCG 
TGAACATTGA TCTGTTTCAG CTTTTCCGAA CCATGCAGGA GCAGCTTCTC GGTAACCAGT 
GCATCGAAGC TCGGGCTAGC AAAGATCGCA TGATTCCCCT GATGTTTCTC CCGTTGATCC 
AAGCAACTCT CAGCAACGTC TTCTTGGCCA AGAGCATGTC TTTTGACGAA GTCGTCGACG 
GCGAGGGTGC GGTACTAGCG GCGGCGTTGC TTCCACGCCT GGCCTCTTGC AATTTCGAGG 
ATGCGCAGCG GTTGTATTTA CAAATGCGAG TCGGTCAGCA CGGAGTGGCA GGTTACTCGG 
AAGTTCGTCA GGCTTTGGAG CGCAACTACG AGTGTTTGGG AGTCACCTGC GCCGACGTTG 
GGGGTTTGTA CGATCGAGAC AGGGGCGAAT ATGAAGCCGA AGGGGCTCCT TGTGGCGGGG 
TCGCGCAGGG AGGCGGCGGA ACGAATCCGG GTCTAGCCGT TGGCTTGTTC CTTGGTGGAA 
TGGTGGCCGT GCTGTTGGGC TTTGTGCTAA TCCGCCACCG CCGCCGTAAC AAGTCGCTAG 
GGGCCGCTGA GTTTGCAGTG GAGGGGGATC ACGTGATTGC GTAA

Protein sequence

MAQIAVGIKA FFLVSLCSGA TASSKNRDLQ EFIAIASYQP RTDVSNQKNI ALDQYELSSF 
LGNPANDDLE AAKAIYERGA FVTPIARLTL TNESGLPTMI TSDETLVTGK TANGTEVTGI 
AYESFNPGEM EISVQYASDA PDSCEVGGLL EPYMHGCFAA DGELDIEGER VAYRYDPSTD 
NYNGRTLQQF STGASFTFRD PNAGTEYFDE FEKFFDYYGK ASYADILIQA AFNKTNTGFR 
NGNLDFSTYL DGDGQNAAIA TATAYMILGM EIIGKLEHAV VQCDLPCETD DCKLDPVHSL 
DEAVAFWTGV LEDFDQGSGR SNLLYGLADE TCRQFRTCGV TGDSTEGTSR VNIDLFQLFR 
TMQEQLLGNQ CIEARASKDR MIPLMFLPLI QATLSNVFLA KSMSFDEVVD GEGAVLAAAL 
LPRLASCNFE DAQRLYLQMR VGQHGVAGYS EVRQALERNY ECLGVTCADV GGLYDRDRGE 
YEAEGAPCGG VAQGGGGTNP GLAVGLFLGG MVAVLLGFVL IRHRRRNKSL GAAEFAVEGD 
HVIA