Gene PHATRDRAFT_10073 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_10073
Symbol
ID	7197552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011670
Strand	-
Start bp	662270
End bp	663562
Gene Length	1293 bp
Protein Length	431 aa
Translation table
GC content	52%
IMG OID
Product	predicted protein
Protein accession	XP_002177979
Protein GI	219112455
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CCAACGGTTT GGACAGAGTT CTCCAGACTA GCGCAGGAGC ATCCTGGCGT AGTGAATCTC 
GGACAGGGAT TTCCCGATTG GTTACCTCCG AAATTTGCCA TCGATAGCCT TGTAGAAGCC 
GCTCTTGATT CGGCACAATC GCCTCATCAA TATACGCGTC CCGCTGGACA TCCCAATCTT 
GTCAGAAAAC TCGCCACACG ATACGGAAAA CACATGCGAC GGGATGTGGA CCCCTTCACC 
GAGGTGGCCG TGACGGTTGG TGCTTCGCAG GCTTTGTACC TAAGTTTGCA GACTATAATC 
CAACCGGGCG ATGAAGTTAT TCTTTTCGAG CCCTTTTTTG ACTTGTACGT ATCGCAAGTC 
AAACTCGCTG GAGGAACTCC CGTCTTTGTT CCGTTGACCT TTGTACCGTA CGAGGACGAT 
ACAGAAACTG TTGTTACAGG CGGTGATTGG GTTTTGGAAG CCGACAAGCT GAAGCAAGCG 
GTCACCACAC GTACCAAAGC AATTTTGTTA AATTCGCCTC ACAATCCTAC GGGGAAAATC 
TTTACCCGTG ACGAAATGGA AATGGTCGCC GAGGCATTGG AACTGGCCAA TCCAGACTGT 
GTCGTGCTGT CCGACGAAGT CTACAAGTAT ATTGTCCATT CACCGCCCAA GGAACGCGCA 
TCAGAAGAAT CGCTTTTTTG TCGTGGACAT GTACACTTTG CCTCGTTGCC TGGGATGTGG 
GATCGGACCA TTACTATTTC CTCTGCCGGA AAGACCTTCT CGGCAACAGG GTGGCAAGTC 
GGCTGGTGCG TTGGACCGAA TCACTTGATT GCTCGTATAC ACCAACTTCT CCCGTACGTG 
CAGTTTTGCG CGTCCACAGT CATTCAAGAA GCTCTGGCTA GATCCTTAAC GCGGGCTGAC 
GAACCCTATG AAGGTCGCGC TTCGTACTAT GATTTTTTGC GGCATACGTA CACGCGGAAA 
CGAGACTTGC TGGCGTCGGC CCTTATCGAC GCTGGCTTTG CAGTACCCGA CTACGACCGC 
ACCGCGGGCG GTGGCTTTTT CATTCTTGCC CGCATCGGTC CAAAGATTCT CTCATCCCTT 
CCAGAAAGTC GCATCAACGT TCCAAACGAC GCTGCCCCTA ACGGCGAGGC ACGCCAGGAT 
TGGGCACTGT GTCAGTGGAT GGCAGAGCAG GATTCAGGAG TCTTGTGTAT CCCTTCAAGT 
CCGTTTTTTT CGTCACTTCG TGTCGCGGAG GGAGTCTCAG ACGAATTCGT TCGTGTGGCC 
TTTTGCAAGA CCGACGATAC TATTGACGCA GCT

Protein sequence

PTVWTEFSRL AQEHPGVVNL GQGFPDWLPP KFAIDSLVEA ALDSAQSPHQ YTRPAGHPNL 
VRKLATRYGK HMRRDVDPFT EVAVTVGASQ ALYLSLQTII QPGDEVILFE PFFDLYVSQV 
KLAGGTPVFV PLTFVPYEDD TETVVTGGDW VLEADKLKQA VTTRTKAILL NSPHNPTGKI 
FTRDEMEMVA EALELANPDC VVLSDEVYKY IVHSPPKERA SEESLFCRGH VHFASLPGMW 
DRTITISSAG KTFSATGWQV GWCVGPNHLI ARIHQLLPYV QFCASTVIQE ALARSLTRAD 
EPYEGRASYY DFLRHTYTRK RDLLASALID AGFAVPDYDR TAGGGFFILA RIGPKILSSL 
PESRINVPND AAPNGEARQD WALCQWMAEQ DSGVLCIPSS PFFSSLRVAE GVSDEFVRVA 
FCKTDDTIDA A