Gene PHATRDRAFT_40861 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_40861
Symbol
ID	7198786
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011694
Strand	-
Start bp	129230
End bp	130537
Gene Length	1308 bp
Protein Length	435 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002184895
Protein GI	219129436
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTCAAA AAAGTAATGC TTTAAGCTTA CGAGTGGCTT GGGCCGTCAT ATTGGCGCTC 
TCGTGTTCTT CGGCATTCTT TGGCTACTAT AACAACGTTC CTTGTCCGCA GGTGTTCCCT 
CCGGATTGGC AAGTCACCGA AAAGCATCGC TTCAGCAAGG CTGTCACCAC GACAGATGCA 
GCAAAGGATC TTGATGCACG TTTGAAACGA GCGTTTGATG CCAGTGTATT GCGAAAACAT 
CGTGCTGCCA CCCTAGAACG GGCCAGCGTG GCTCCATACA AAAACATGGA TTTACAGTTA 
TACCACAAAC CACATCCAGT TCTTAATCCG CTGGATCCAA AGTTGCGACC TAAGCCAGAA 
TGGGGTAACA CCACCTTTCC TGACATCAGC GTCGTGGGCT TTCCAAAGGC CGGAACCACT 
CAGCTGTACA ATATTCTCGT TTCACACAGT GAGGCAGAAG CCTTCAACAA GCGCGACAAG 
GAATTCTGTT TTGCGGGGAA TGAATCATCC TTGTCCCGGA ATAACAACTG GGAAGACTTC 
GTTCCAGGAT CACGACCGAC CACCATGCAA ATCGAACTCC AGGAAGCCTT GCATACAGCC 
TTACAGAAGC ACCGAAACCT TAGAACATCT TCTCAAAAAA AAACTGTAAA CGGATGCTTA 
AGCCAGCGTA TCGTCTCGGT CGTTTACGAC TACTTCAATC AACCATCGAA TAAAAAGTTT 
ATCATTGCAT TGAGAGACCC TGCGGATTGG TTGTGGGCCG TTTACAATTT CTGGGCTCTC 
CCGGATATAG ATACCGTTGT TCCCCGCCCA GATTGGGCTG CACCAGAGCA ACACTATCGG 
TCGCCCGAAA TGTTCCACGA TCTTGTAGCC TCCAGTCATG AGATGCTTTT TTTTGAAAAA 
ATGTTGGGAT CAAGGGGGAA GCATGCTATG GATTACGTTT GGCAGTTCGA AGCAATGGCG 
GGACGGGAAA ATATTCTCTA CATTCGCAAC GAAGATCTTC TACCAGGGGT TGTCGCGCGG 
CCGGGAGGAG TCCTCGACCA GCTGGCTGCT TTTACGGGCC TAGATCGTAA AGGTTTTGAC 
TCGCAGACGT TCGGCGAGAT ATCCAACTGC AACGACCAGA AAGGGTTTGT GAAAAAATGT 
GGAACAGCCA AGAGTAACGC GTACGAAATC ACTGGAGGAA GATCCATGCT TCCAGAAACG 
CGCACTCTGA TATATTTACT CTATTACGAA GAATGCAAAC TGTGGTCGCA AAGATACGAT 
GTTGTCTACG AGGACTGTTT GAATGTGTTG GAGGCAACTA AATCTTAG

Protein sequence

MGQKSNALSL RVAWAVILAL SCSSAFFGYY NNVPCPQVFP PDWQVTEKHR FSKAVTTTDA 
AKDLDARLKR AFDASVLRKH RAATLERASV APYKNMDLQL YHKPHPVLNP LDPKLRPKPE 
WGNTTFPDIS VVGFPKAGTT QLYNILVSHS EAEAFNKRDK EFCFAGNESS LSRNNNWEDF 
VPGSRPTTMQ IELQEALHTA LQKHRNLRTS SQKKTVNGCL SQRIVSVVYD YFNQPSNKKF 
IIALRDPADW LWAVYNFWAL PDIDTVVPRP DWAAPEQHYR SPEMFHDLVA SSHEMLFFEK 
MLGSRGKHAM DYVWQFEAMA GRENILYIRN EDLLPGVVAR PGGVLDQLAA FTGLDRKGFD 
SQTFGEISNC NDQKGFVKKC GTAKSNAYEI TGGRSMLPET RTLIYLLYYE ECKLWSQRYD 
VVYEDCLNVL EATKS