Gene PHATRDRAFT_47239 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_47239
Symbol
ID	7202208
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011680
Strand	-
Start bp	895262
End bp	897098
Gene Length	1837 bp
Protein Length	564 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002181465
Protein GI	219122254
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.403327
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGATCA ACAACGCCAC CGAGACCAAG TCTCGCAAGG ATCGTCCTGC TGGATCCATC 
CATTTCGGCG ACACCGACTT CGATGTCGAC GAGCAAGCTG GAGCCGCTTC GTGGGGCGAA 
GTATGCCACG CTTGTTGTGT CCATTCTGGA CAGGAATGGG CCATGATCGC TCTTGGGATC 
TTCCTGGTTT GCTTCTTCCT CTACTTCTTC CTGGTGGGTC TTGACTTGCT TGGAAACGGT 
GCGAGGGTTA TGACTGGATG CACTGCCGGA GAGTTGTTTG GTGACGACAC TAATCCCATT 
GCTGGTCTGA TGATTGGTAT CCTTGCGACC GTATTGCTCC AGTCTTCTTC TACGACGACC 
TCGATTGTTG TGTCGTTGGT TGGTTCCGCT GTCTCTGTCC GTCAAGGAAT TTACATGATC 
ATGGGAGCAA ACATTGGCAC TTCAGTAACC AACACGATTG TTGCTATGGG TCAGATGGGC 
GATGGAGATC AGCTGGAGCG TGCTTTCGCT GGTGCCACTG TCCATGATAT GTTTAACTTT 
TTGTCGGTGG CTGTACTACT CCCTGTAGAA GTCATCACAG GATATCTTTA TCGGCTTACC 
AAGGCAATTG TCAAGGATGC CAATCTCGAA GACGGTGAAA GCTGGGATGG TCCCATCAGT 
AAGCTGGTTG ATCCTCTTTC GGAAAAGATC ATCATTCCCA ATAGTAGTAT TACCCGGGCT 
ATTGCTTTGG GTGACGCAAC CTGCAATGAC GGCGGCGGCT TCTACCCCAT GAATTGTACG 
GAAGACACGT ATTTGGGTTG TGGCGGCGCA TTTGGTCTCA TTGCCTGTAG CAGCGATAGT 
GGTAAATGCC CTGCTTTCTT TCAAGGTGAC GCTTCGGCAA GGGATGACAA GGTCTCTGGA 
GGTGTTGTCT TTTTCATTGC TATTGTCGTC CTTTTTGTTT GTCTCGCTGG GCTTGTAACT 
GTTCTTCAAA AGTTACTGCT TGGTATGTCC ACTCGCGTTG TCTACAAAGC CACTGATATA 
AACGGATATC TTGCGATTGC TATTGGTACT GGTCTGACCA TGCTTGTGCA GTCCTCCTCC 
ATTACTACGT CCACTTTGAC TCCGTTGGTT GGTATAGGAG CGCTTCGTCT TGAGCAAATG 
TTGCCCCTTA CACTTGGTGC TAACATCGGT ACAACTCTGA CTGCCATTCT GTCTGCCCTC 
GTGTCTGCCA GCAAGGATTC GCTCCAGGTT GCACTTGCCC ATTTGTTCTT TAACTTGACT 
GGAATTCTCA TCTGGTACCC TGTGCCTTTC ATGCGTCGTG TCCCTCTCGG AGCTGCTCGT 
AGACTTGGAA AATTGACGCG AATCTGGCGT GGTTTCCCCA TTCTTTACAT TGGAGTGATG 
TTTTTTCTCA TTCCGCTTCT TCTGCTTGGC CTGTCGTCTC TTTTCGATGA TGGCAGCACT 
GGTTTTACTG TCCTGGGATC CTTTCTTACC ATCCTTTTGT TCCTTACCAT TCTTTACGCT 
GTCTACTGGT TCCGTTACAG AGACGGTCGG CAGAAGTGCT CAAACAGCAT GGCCCAGCGT 
GAGAAGAATC GCGTCGTAAT GAAAGAACTC CCTGACGACA TGGTGTATCT AAAGGAACAC 
ATAAAGCGTC TTATTGAACA CACTGGACTC CCCGAAGACG AGGATGTCCA GCCAAGTATG 
AATCTCCTGA TACTTCGGAT GCTGAAGTTG ATACCTAAGC ATCGTGTGAG AGATCGATGT 
CGCTGTGTAT CGGTTGGAGG ATCCCTCTTG ATTATTTGTT TAGTATATAC TACATACAAT 
CTGTGCCAAG AGTATAGTTC TCGCAGATAC TGTTTGA

Protein sequence

MEINNATETK SRKDRPAGSI HFGDTDFDVD EQAGAASWGE VCHACCVHSG QEWAMIALGI 
FLVCFFLYFF LVGLDLLGNG ARVMTGCTAG ELFGDDTNPI AGLMIGILAT VLLQSSSTTT 
SIVVSLVGSA VSVRQGIYMI MGANIGTSVT NTIVAMGQMG DGDQLERAFA GATVHDMFNF 
LSVAVLLPVE VITGYLYRLT KAIVKDANLE DGESWDGPIS KLVDPLSEKI IIPNSSITRA 
IALGDATCND GGGFYPMNCT EDTYLGCGGA FGLIACSSDS GKCPAFFQGD ASARDDKVSG 
GVVFFIAIVV LFVCLAGLVT VLQKLLLGMS TRVVYKATDI NGYLAIAIGT GLTMLVQSSS 
ITTSTLTPLV GIGALRLEQM LPLTLGANIG TTLTAILSAL VSASKDSLQV ALAHLFFNLT 
GILIWYPVPF MRRVPLGAAR RLGKLTRIWR GFPILYIGVM FFLIPLLLLG LSSLFDDGST 
GFTVLGSFLT ILLFLTILYA VYWFRYRDGR QKCSNSMAQR EKNRVVMKEL PDDMVYLKEH 
IKRLIEHTGL PEDEDVQPIL ADTV