Gene PHATRDRAFT_42647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_42647
Symbol
ID	7196000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	+
Start bp	693275
End bp	694479
Gene Length	1205 bp
Protein Length	389 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002176631
Protein GI	219109755
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GAAAAAGTCG AAGCTCATCC CGAAAGGAAA CGAAGATGGT AGCCAAACAC AAGAGGATCA 
TACAAAGTCC GACGCATCAC GTTAATGGTG CAGAAATAGT CCTACCGCAA CATGGATATG 
CTCCGGGAAA GTCTCCGCTG AATATGAAAT CCGACAGCAG TGGAAGCAGC GAAGACACGG 
TTTCGACTAG GGAGACCTTT TGGATAGGGG CACTCCATGA CAGCGAGGAA ATGCAACTAC 
CAACCTGGTC GGGGAATCCA CAAAGTCCTT TAGATGGAGG GCACTCATCA AGGAATACAC 
TATTATTCAC AGCTCACAAG CGAAATTTCT CGGCGCCTTT GTTCCTTATT GCCTTCGTTC 
TCGTGGGATT GGCTGCGATG GTTACTTCAA GAATTACAGT GAACGATGCT TCCGAGCAAG 
TATCACTATT GACCACCAAT AGAGCGAAAA TGAACTTGCA ACTTCAAAAA TCACAAAAGG 
ACATGCTCAG TCTGAAACGT AAAATCTCGG CAATGGATGC CATGATTCAA CAGCAGCAGG 
GCATGGACAC TAACGCTTCC AGTTCAGGCG CTATTCAACA GCGTGCCTTA GAAGAAGTGA 
ACAGTCTGCA AGAAAGCCTA ACGTTTTTAG GGAAACATTC TGAGGCATTA AAAAAACAGG 
TGCAATCCAT GAGCCTTAAA TCCCTCGAAG ATTCATATGG ATCTTTGATA CAGCGTGTCG 
AAGTTGAACT TCAATTTCCT GATCACAAGG TGGGGCCCCA CAAATTCGTC ATCGAACTCG 
CACCTATAGA GGTTATGCCG CATTCTGTCG ACGTTTTTCT CCGAATGGTT TCGACTCACT 
TACTTGATGG ATGCTCCTTT ATCCTAAACG CTTTGCATGT GGTAAAGGCC GCCCCGCTTC 
CATATGACGG CAGTTCCGCT GCCGACAAGG CGAAGGCATT TACCGAACAC GGCTTGGAGA 
GCGTAGCTTT CCGTGAATAC AACGCAGACT ACCCGCATAA ACAGTATACG GTGGGTTTTG 
CCGCAGACGG CAGTCCGAGT TTTTACATCA ATACAGAAGA CAACAGTGAA ATTCACATCG 
GAGATCCATG CTTCGGCAGG ATAGTTGAGG GTTTCGACAC TATCCGCAGA TTGGAAGCGA 
GTCCTACCCG TAACGGTATC TGGTTTGAGA AAAGGATAGG CATCAAACGA GCTCGAATCT 
TATAG

Protein sequence

MVAKHKRIIQ SPTHHVNGAE IVLPQHGYAP GKSPLNMKSD SSGSSEDTVS TRETFWIGAL 
HDSEEMQLPT WSGNPQSPLD GGHSSRNTLL FTAHKRNFSA PLFLIAFVLV GLAAMVTSRI 
TVNDASEQVS LLTTNRAKMN LQLQKSQKDM LSLKRKISAM DAMIQQQQGM DTNASSSGAI 
QQRALEEVNS LQESLTFLGK HSEALKKQVQ SMSLKSLEDS YGSLIQRVEV ELQFPDHKVG 
PHKFVIELAP IEVMPHSVDV FLRMVSTHLL DGCSFILNAL HVVKAAPLPY DGSSAADKAK 
AFTEHGLESV AFREYNADYP HKQYTVGFAA DGSPSFYINT EDNSEIHIGD PCFGRIVEGF 
DTIRRLEASP TRNGIWFEKR IGIKRARIL