Gene PHATRDRAFT_53961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_53961
Symbol
ID	7196307
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	+
Start bp	675017
End bp	677388
Gene Length	2372 bp
Protein Length	668 aa
Translation table
GC content	49%
IMG OID
Product	RTX toxins and related Ca2+-binding protein
Protein accession	XP_002176627
Protein GI	219109747
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGTAT CGATGAACGC AACTCCCGAA GAAGAGGAGA CGCCGCCGCC AAAGTGGAGG 
AGAAAGGAAG AGGAGGAAGA GGACGTTGGA TGCCAGCCTG TTGGCTCATG CCCTCATGGA 
TCCGTCGGGA TCATGGCGAT CCTTGTGTCA ACTGGTCTTT TCTGTTTGTC CGCTGCCGCA 
GCTGGTAGTT GTACCTTTGT TCTCGTCGAC ACCGTCGAAA GAAATGGTTT AAGCTTCGAA 
GATCGTAGAA TAGGGCTGTA TCGGTTTGAA GATAAGCGTA CAGACTCCTC CTGTTTATTT 
TGGACGTCTG GTGAGAACGC CGATCGTGTG TACAATAGTC ACTGGAGTGC TGCTCGTGCC 
CTTGTCTGGG CCGCCTTGAT CCTAACGCTC GTGAGCGCAG TCTTTCTATG CAGTGCCAGC 
TGCTACGCGC ATCCCAGAAA GCTCTTCCAA TCGCTCTCTT TTTTATTTAT TTTCAACTCT 
ACGCTGTTTG GGATGTCCTT CATCGTCTTT GCGTCAGACA TTTGTCAAGA AGCTGGATCT 
TGTGCCATGA GTACTGGAAG TATAATGATG GTTGCAGTTG CGGTTCTCTG GTTATTGACG 
TCCTTACTGC TGCTCTATAT TCCTTCTTAT TATAAGAACC CGCGCTCTCC AAGGGAGAAG 
CCTCGGATTC AATTTAATTC GACACAAAAA ATCTGGTGTA TGGCTGCCTT GATTGCTGTC 
TTACTTATCG GACTAGTCAA CGGTTTAATA ATTGGACAAA GCGATGGTTT CTCTGAGAGG 
AATGGAACTG ATGTTGTCTC ATCACCAGTC CCGGAGATCT CCAGCCCTCC GCCAAAAAGT 
TTTCCAGGCT CCTGGGATAC TATTGCCATT GTTCCTGGCG GTTACCAAGG GAACGCCATT 
TCACTGGCTC CTGGTGGGCG GGCAATCGCG GTGTCTACTT CGTACAATCC AGGCCGTCTC 
TCGTTTTTCT ATCAACCTGA AAATAGTCTT ACGTGGACAG TCCTGGGTGA GACGGGAGGA 
CACATCGGAC CGCCGAGTTT CGGTAGGTCC CTCGCGCTTT CCGATGTTGA CGTTTATGCT 
GTCGGTACTC CAGATTTTGC TGTTGATGGA GTAGCATTTG GACGAGTGGA TGTTTGGTTC 
TATGATCGTG ACGCAGAAGC TTGGTTGATA GACGGTTTAC TGATTGGCAA CAAGCCAAAC 
TTTCATTTCG GCAGCGATGT GGCGATTACG GCTGGTGCCG ACTATGCGGC AATTACTTCA 
ACTTCTATGG AAGACGGCGC ATCGGCGGTC CAAGGCTATG CATATAGCGA AGAGTTGTCG 
TGGGTTCCTA TCGGCCAGGA AATTTCCCTT CTCCAGTCCA GTCCGGCAAC AAGTGGTTGG 
AATGCGACTT CGTCATTGAT TATTTCTCCA TCGACTGGGG TGGTCACATT GTCGATCGGA 
ATTCCTATTC AGGATATTGG AGGGATGGTT ATCGTGTGGG ATTACCAGCC TGCAAATGAT 
GTATGGGTAC AGAGGGGCTC GACTATTGAT GCGAATGCTG TCGCCAGCTC AGACGACGGC 
GACGACTTTG GATATTCTGT TGCTTTAAGT GAAGATGGCA ACGTTCTCGC CGTGGGTGCC 
CCCCAGGGCG GAAACAAATC GACGGGTAGC GGTGGTCACG TACGAATCTT CTCATTCCAA 
CCAGGGACAT GGCAGCAAGT TGGGCAAGAT TTGACTTGTG GATTGAACGC AAGACGTTGT 
GGGGAATCCG TTAAACTGAC ATTTGATGGA AAGATGGTTG TGATTGGAGA CTCTGGGTTT 
GATGGTGGTC GTGGACGCGT TATTGTTTAT CAGATTGACG ATTTTGCGGG CGAGTGGTAT 
CAGTTCGGAC CCGTCATTAA CGGGGAATCT TCTGGTGGTG TTGGCGCAAA AGTTTCGATT 
TCTCGTTTTG GAGAACTTGT GGCCTACACT GATGCTACCG AGGGCTCCAG AAAGGGCGTG 
TTGGTAGAAT ACAACCCAGA GGAATAGCTT CAATTAGTCA TTGTCCATCG ATGTGACGGT 
CTGCAGAATT TATGTGCGTA CTTTTTTGTC GGCGCTGCTA CTTTCTGATC TTATTGCGCA 
CGCAATTGCT TTACGGTATC TGTATCGTTG GTGAGTTGGA ACTCTGCTGT GGTCCTTCAC 
AGATGCATAC CGATCAACTG TATAGACATG ATTGTTCCCC CAGAAAGCGA GGCAATGCTA 
GTATCGAGTG GCTAGCCATG TGGGTCCGAC ATTCCCGAAG ACTCGACAAA TGACGCACTA 
TTTGCCTTAA TGAAGTTCGA GCTGCAAGAT TATGTGTGTG TTTTCCATTG GATTGACACA 
TATGTGATGC CGATTAAGGC CTTCACTGAT GC

Protein sequence

MAVSMNATPE EEETPPPKWR RKEEEEEDVG CQPVGSCPHG SVGIMAILVS TGLFCLSAAA 
AGSCTFVLVD TVERNGLSFE DRRIGLYRFE DKRTDSSCLF WTSGENADRV YNSHWSAARA 
LVWAALILTL VSAVFLCSAS CYAHPRKLFQ SLSFLFIFNS TLFGMSFIVF ASDICQEAGS 
CAMSTGSIMM VAVAVLWLLT SLLLLYIPSY YKNPRSPREK PRIQFNSTQK IWCMAALIAV 
LLIGLVNGLI IGQSDGFSER NGTDVVSSPV PEISSPPPKS FPGSWDTIAI VPGGYQGNAI 
SLAPGGRAIA VSTSYNPGRL SFFYQPENSL TWTVLGETGG HIGPPSFGRS LALSDVDVYA 
VGTPDFAVDG VAFGRVDVWF YDRDAEAWLI DGLLIGNKPN FHFGSDVAIT AGADYAAITS 
TSMEDGASAV QGYAYSEELS WVPIGQEISL LQSSPATSGW NATSSLIISP STGVVTLSIG 
IPIQDIGGMV IVWDYQPAND VWVQRGSTID ANAVASSDDG DDFGYSVALS EDGNVLAVGA 
PQGGNKSTGS GGHVRIFSFQ PGTWQQVGQD LTCGLNARRC GESVKLTFDG KMVVIGDSGF 
DGGRGRVIVY QIDDFAGEWY QFGPVINGES SGGVGAKVSI SRFGELVAYT DATEGSRKGV 
LVEYNPEE