Gene PHATRDRAFT_49755 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_49755
Symbol
ID	7198342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011692
Strand	+
Start bp	173995
End bp	175161
Gene Length	1167 bp
Protein Length	368 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002184501
Protein GI	219128609
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

AAGGTCATCG GAGACGTAGA ATGACAATTG ATGATGAGGA GACTGACAAA TCATCCACCC 
AGAGTCCTAA GAAGGCGCTC CAGGTATTCA TTCGACGACC ACACAAGAAA GGCGTGCACA 
AGTTGGAACA CAAACGTTCC AGCTCGCCTT CAGTAGCTTC CCGTAAGCGC TCGGGACAAT 
TGGTGATCAG CAGCAACCAC GGCTTACCTT CCATTGGTCG GAAAGTTTCA GAAATACGGA 
AACCTGTACT GACATCGGTG CACAGATCCG AGATCGATAC CAACGATTTG TTCCGAGAGA 
ACGACGATTC CGTCTTCCCG GATGTTGCCT GCGTGTCCGA TACTCTCTTG GCAATTCAGA 
GCCTAAAGAA CGGCAGTAGA TCCCAAACGA TTGCGATACC TCTTACGCAA GCGCCTGGAA 
GACAAGCACA GCAACGAGCA CCGCATTATA TACACGGAAT TCTCGAATGC CAGCTCTATA 
TTCTGATAAA GGATGCGAAC AACCATTTCC CATCAGTCGG AGGTACAGTA CCGTCTTTGC 
AAGTTAGTAC AGAATTGCCG CAACTACTAC GGGCGAATAA ATTGCGGAGA CTTTCCTCCA 
CTACGCAATC CTCCCATCCG CTGACCATCT TGCTGGAAAC GAACGATTAC GTTCGCGCCG 
TGTGGGATGC GCACCACCGG TACCCGGGTA ATGCCGCTGC CACCGAATGG TTTCTCAGCA 
TTCTCCCCAA ATGTACCGGG CTCTGCATTC CAATAATACA GCTAGAAGAA CTGTACCGTA 
ACAGTTCCGT GGAATGCAGC GAGCCCCTGG AGTCCATTCT TAAGCAATTG CAGCAGATGC 
AAGTGCTCAT GGCGTCGCAT TCGTCCGGCG TTTTTCAATT GTGGCTGCCA TCTTGGGGTC 
TCGTTTTGAA CGCTTGGGAG GCAGCCCGCA GAAAACTGCT TTTGCAGCTC AAGCAGAGCT 
CGTTCCAGGA ACGTTCCGTA CAAGCTTTGC AACAAGAGTA TAGCCCAATC GACACGAAGC 
TTCTGATTGA CTGGATGGTC GACCAGGGCG AAGTGCAATT CCGAAAACGA CCCGCAGGCG 
TCTTTGTCAA ACTCCTGGCT TCTGATGAGT CTTGGTCGAC AAGATAATTC AGAGAGACCA 
ACAACTAAAT TTACGTGTTA TGTTAGC

Protein sequence

MTIDDEETDK SSTQSPKKAL QVFIRRPHKK GVHKLEHKRS SSPSVASRKR SGQLVISSNH 
GLPSIGRKVS EIRKPVLTSV HRSEIDTNDL FRENDDSVFP DVACVSDTLL AIQSLKNGSR 
SQTIAIPLTQ APGRQAQQRA PHYIHGILEC QLYILIKDAN NHFPSVGGTV PSLQVSTELP 
QLLRANKLRR LSSTTQSSHP LTILLETNDY VRAVWDAHHR YPGNAAATEW FLSILPKCTG 
LCIPIIQLEE LYRNSSVECS EPLESILKQL QQMQVLMASH SSGVFQLWLP SWGLVLNAWE 
AARRKLLLQL KQSSFQERSV QALQQEYSPI DTKLLIDWMV DQGEVQFRKR PAGVFVKLLA 
SDESWSTR