Gene PHATRDRAFT_20589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_20589
Symbol
ID	7201284
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011677
Strand	+
Start bp	629311
End bp	630676
Gene Length	1366 bp
Protein Length	434 aa
Translation table
GC content	52%
IMG OID
Product	predicted protein
Protein accession	XP_002180474
Protein GI	219119426
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TGTCAATACT CCAGGTCGCA CCGCTTCCAA GAGGCTCTTC ACTTTACAGG TCGATTGCAA 
TATGACCGAA CAGGAACAAA ACAAGACAGA TGATTCCACA AAGTCCGGAA GCGCATCCAC 
TGCTCCGACG CCCCCCATTA CTAACAGTAC GCTGAAAACG ACCAACGCCG ATGTGGGAGT 
GGTAGTTCGG CGCCGACGTC GTCGGGTTGT GGCAGAGGAA GAAGGACCGG CGGTCGATCC 
AATTTTGTTG CAAAAAGTGC TCACCGAGTC AAGCTTACCG TCGGCCTACA CGTTTGAAGT 
TACGAAGAGC GTGAAAAGGA TCCTGAAACT CCAAGCAACA CATGTGGCTT TGCAAATGCC 
CGAAGGTCTC TTGTTGTACG CGACTGTGCT CGCGGATGTT TTCCAACGGC TGGCATCTTG 
TCTTCAGCAA GTATCGATCT TGGGTGATGT CACCTACGGG GCCTGTTGCG TTGACGATCT 
TGGTGCACAA GCCCTGGGTG CCGAACTCTT GATTCACTAC GGACACTCCT GTCTGGTTCC 
GCTTCAACAT ACCGTTGTGC CGTGCCTGTA CGTCTTTGTG GAAATTCACG TGGACGTGCC 
GCATTTGGTG GACTGTCTAG ATATTACTTT GAGACCGCAA AGTCCGAAAC CGCGTGTGTA 
TTTGCTGGGG ACGGTGCAGT TTCGCCACGC TTTTGTACAA GCAACGCAGC TTTTGAAGGA 
AAAGGGATAC GAGGAAGTTT CTATCCCCCA GGCCAAGCCT CTTTCGCCGG GCGAAGTTTT 
GGGCTGCACC AGTCCAGAAT TGGTAAACGA TGGAGTGCGA TCGATTGTTT GTTTTGTCGC 
CGATGGTCGC TTTCATTTGG AAGCGACCTT GATTTCGAAT CCACACGTCG ATCTATTCTA 
TCGCTATGAC CCCTATTCGA AAACGCTTAC GGAAGAAGCC TACGATCACG ACCAAATGAA 
GTCCATCCGC TCATCCGCAA TTGCCACGTC GCGAGGAGCT CAAGTCTATG GCATCGTACT 
GGGCACTCTG GGTCGTCAGG GTAATCCAGC TATTGTTCAC CGCATTCGGG AGTCACTCCG 
GGCACATGGT AAACGACATT TTCTCATGCT GTTGTCAGAA ATCACACCAG CCAAGCTGCA 
GCTGTTCGAC GGCAAGATCG ACGCGTGGGT ACAAGTGGCA TGCCCTAGAC TTTCCGTTGA 
CTGGGGACAT TTCTTGTCGA AAAAGCCTGT TCTAAGTCCT TACGAACTTT TTGTTAGCTT 
GGAGGAAACT GACTGGCGAG ACAATTATCC GATGGACTAC TACGCACACG CCGGAGGCCC 
GTGGACGAAC TACTTTGAAG AAAACAAGCA ACGCCAGTTA CCGTGA

Protein sequence

MTEQEQNKTD DSTKSGSAST APTPPITNST LKTTNADVGV VVRRRRRRVV AEEEGPAVDP 
ILLQKVLTES SLPSAYTFEV TKSVKRILKL QATHVALQMP EGLLLYATVL ADVFQRLASC 
LQQVSILGDV TYGACCVDDL GAQALGAELL IHYGHSCLVP LQHTVVPCLY VFVEIHVDVP 
HLVDCLDITL RPQSPKPRVY LLGTVQFRHA FVQATQLLKE KGYEEVSIPQ AKPLSPGEVL 
GCTSPELVND GVRSIVCFVA DGRFHLEATL ISNPHVDLFY RYDPYSKTLT EEAYDHDQMK 
SIRSSAIATS RGAQVYGIVL GTLGRQGNPA IVHRIRESLR AHGKRHFLML LSEITPAKLQ 
LFDGKIDAWV QVACPRLSVD WGHFLSKKPV LSPYELFVSL EETDWRDNYP MDYYAHAGGP 
WTNYFEENKQ RQLP