Gene PHATRDRAFT_12346 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_12346
Symbol
ID	7200800
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011676
Strand	+
Start bp	269450
End bp	270830
Gene Length	1381 bp
Protein Length	408 aa
Translation table
GC content	54%
IMG OID
Product	predicted protein
Protein accession	XP_002180004
Protein GI	219118464
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCTTGA TCGAAAAGGG TGTCAAGGAA GGGCTCAAGG CTGCCAACGT CAAGTTTCCG 
GCACAACTTG GCGGTTGCAT CTTTCTCTTT TCCTTCATGA TGCTGGCAGA AAAGATCAAT 
CCCGAACTCG GCAACGCAAT CTTCGAAGCC TTGTCGCCCG GAGCCGGGAT TCTGGCCAAG 
TGGCTTCCCG TCTTTTTCGT TCCCGGCCTA GCACTCTTGC CCTTGTCACC GAAGATTGGG 
ACCAGTGTCG ATGTAAGTTT CGTGTCGGGA GAAATGTTGG TATTGGCGTT GAGATTCCGT 
TGCCGGGTTC AACTCGTGAA GAAATCTCAC ACTTGGGATT GTACAAACTC TATACCGACA 
GGTTGCCAAA GTCATTATGG TTTGCTGTCT CGGATTTGTC TACACCGTCA CCACCACCGT 
TGCTTCCGTC TTGACCGCTC TCAAAGTACA AGGAACCCCG GTCAAAGTTG CGTCCGTTGC 
CCAAACGAAG AAGACCGCCA CCGCTACACC GGCCAAAAAA CCGTTTAGTG ACGCCACAAT 
GGGTTTCTTT ATCAAGGGAA CCTTTATCAC TGCAGTTCTC AGTCTCTTGG CCACCAAGAT 
GAACAACGAC TTTAGCAGTC CATTGCAAAC AGCCTTTTTG GGTTTCTTTA CCTTTGCGGC 
CTATGTTTGG GGGGCCCGTC TACCGACCGG CTTTGTTAAG GTTATTCATC CCTTGGTCAC 
CAGTTCCATT CTCGTACTGG GACTCATGCA AGCGCTGGCC CGGATCAACG GCCAAGACTT 
TCTGGACGTT GTCCGTAGCT ACAAGGTGGG ATCGTTGTAT CCCATGAAAG CCGGTGCCGG 
AGATATCCTT TTGTATCTTT TGGGACCCTC CGTGGTGTCC TTTGCTATTT CCATGTACAG 
TCGTCGTGAT TTGCTCAAGA GCAACCTGCT CGTAGTATTG ACGGCCATGT TCGTTTCCAG 
TGCCGGTGGC CTCTTCGGGA CAGCCGCCTT TGTCCGTCTC ATTAATTTGG GAGGACGCGG 
CGGACGCATG GTGCGACTCT CGGTATTGGC CCGCAACATT ACCACGGCCT TGTCCATGGC 
ACTCACCGCC ATGTTGGGCG GAGACATTTC CGTCGCGGCC AGTGTAGTTG TCTTGACGGG 
CATTATTGGT GCAACCTACG GCAAGGCCCT GTTGGCGTTG TTGAACATTT CGGATCCTAT 
CGTTCGTGGA TTGGCCATTG GATCGTCGTC GCAGGGCCTC GGGGTGGCGG CCATTTCGGA 
CGAGCCGGAC GCCTTTCCTT TTGCCGCTAT TTCCATGGTT TTGACGGCCA TTTCCGCCAC 
CACTTTGGTT TCCATCCCGG CCGTCCGGGC AGCGCTGATC CGTACGGCCG TCGGTAACTA 
G

Protein sequence

MALIEKGVKE GLKAANVKFP AQLGGCIFLF SFMMLAEKIN PELGNAIFEA LSPGAGILAK 
WLPVFFVPGL ALLPLSPKIG TSVDVSFVSG EMLVLALRFR TPVKVASVAQ TKKTATATPA 
KKPFSDATMG FFIKGTFITA VLSLLATKMN NDFSSPLQTA FLGFFTFAAY VWGARLPTGF 
VKVIHPLVTS SILVLGLMQA LARINGQDFL DVVRSYKVGS LYPMKAGAGD ILLYLLGPSV 
VSFAISMYSR RDLLKSNLLV VLTAMFVSSA GGLFGTAAFV RLINLGGRGG RMVRLSVLAR 
NITTALSMAL TAMLGGDISV AASVVVLTGI IGATYGKALL ALLNISDPIV RGLAIGSSSQ 
GLGVAAISDE PDAFPFAAIS MVLTAISATT LVSIPAVRAA LIRTAVGN