Gene PHATRDRAFT_46564 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_46564
Symbol
ID	7201847
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011678
Strand	-
Start bp	731591
End bp	733049
Gene Length	1459 bp
Protein Length	448 aa
Translation table
GC content	54%
IMG OID
Product	predicted protein
Protein accession	XP_002181063
Protein GI	219120658
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0400699
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTCTGTCGGA GCTTTCCTTT ACAACCTTTA AGACCCACAA GGTCATACAT GTATTGCAAT 
ATGGTACCAC AGAGGAGAGG AAGTAGAAGA CGACGACGAC AATCGCATTT GACGCAGCAA 
TGTACTCGCG TCGTTTGTCT TCTGATATTG GGGAAAACGG CCTCCCAACC CGCTGAAGAA 
ACGGTCGCCG CCTCGCTACC ATTGTCGCAA CCACACCTTC GCAGACGTCA CGACAACGGT 
AATACCGTGG AACTTGTTCC GAATGCGACC GTCCGTCTGC CTCTGCACGC CGTCGCGGGT 
ACGCATCACG TGACGGCTTG GATGGGGGAA CCGCCGCAGG CGCAAACGCT GATTGTCGAC 
ACCGGGTCGC GGTTGACGGC GACCGCGTGC GAGCCCTGTT CGCAATGCGG GACGACGCAC 
GCACACCCGT TCCCCCATTT GGACCCCCAG CGGTCCAGCA CGCTGCGATA CACGCAGTGT 
GGATCCTGTC TGCTCAGCGG CATCCAGGAA TGCGCAGCGG AACAAAAGTG TGGTATTAAT 
CAAAGGTATA CCGAAGGCTC CAGCTGGACA GCAGTGGAAG TCAGCGATAC GTTTGTCCTG 
GGAGGACCGG AAATATCCAG TTTGGAACAG TACGTGAGCT TTACGATTAT CTTTGCGTTC 
GGATGCCAGC AAAAAGTCAG GGGATTGTTC CGAACACAGT ACGCCAACGG TATATTGGGT 
TTGGAACGGT CCGACCTCTC GCTCATTAAG CGATTGTGGA AGGAAAATGT CATTCCTCGC 
GAGTCGTTCT CCCTATGCAT GACACCTTTT GAAGGCTACA TTGGACTGGG AGGACCACTA 
CGAGACAAGC ATACGGAATC GATGAAATAC ACGCCGTTCA CTTCCACTCA GAGTTGGTAT 
GCTGTCCACG TAGTCCGAGT GTTTGTAGGG GACGAATGCT TGACAAGCAA TGACCAGCAC 
GACACTGTTG TCGAGCATGC ATTGGTCGAA GCCTTTGCAG AGGGCAAGGG TACTATACTG 
GACTCGGGAA CGACGGACAC GTATCTCCCC AAGGCAGTTG CGGGTCGTAT GCGAGAAATA 
TGGGCGCGCC TTTCCAACAC GCCCTTTCAA CCGTCGAGCA CGTACGCCTA CACATACGAT 
GAGTTTAGAT CGCTGCCCAT CGTGACCTTT GAGCTCGCCA ACAACGTAAC CTTACAGGCC 
CTGCCTAAAA ATTTCATGGA AGACCTTCCC GAGCCTTTGC GGCCCTGGAC GGGACGGAGG 
AAACTAATGA ACCGCCTGTA CGCGGACGAA GTACAAGGTG CCGTGGTGGG ATTGAATACA 
ATGGTGGGCT ATGACTTGCT CTTTGACGTC CAAGGCAATC GTTTTGGTGT CGCCCCGGCC 
CTATGTGGAA TTGCGAACAG TACACCAGCA GCGACTCATT AAAACGGAAG CGTTTGTAAA 
GGTTTTTTTT GACAATTAA

Protein sequence

MYCNMVPQRR GSRRRRRQSH LTQQCTRVVC LLILGKTASQ PAEETVAASL PLSQPHLRRR 
HDNGNTVELV PNATVRLPLH AVAGTHHVTA WMGEPPQAQT LIVDTGSRLT ATACEPCSQC 
GTTHAHPFPH LDPQRSSTLR YTQCGSCLLS GIQECAAEQK CGINQRYTEG SSWTAVEVSD 
TFVLGGPEIS SLEQYVSFTI IFAFGCQQKV RGLFRTQYAN GILGLERSDL SLIKRLWKEN 
VIPRESFSLC MTPFEGYIGL GGPLRDKHTE SMKYTPFTST QSWYAVHVVR VFVGDECLTS 
NDQHDTVVEH ALVEAFAEGK GTILDSGTTD TYLPKAVAGR MREIWARLSN TPFQPSSTYA 
YTYDEFRSLP IVTFELANNV TLQALPKNFM EDLPEPLRPW TGRRKLMNRL YADEAIVLVS 
PRPYVELRTV HQQRLIKTEA FVKVFFDN