Gene PHATRDRAFT_34199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_34199
Symbol
ID	7197906
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011672
Strand	-
Start bp	1353815
End bp	1354959
Gene Length	1145 bp
Protein Length	321 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002178687
Protein GI	219115783
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTTCTA CAGAAAAGGA GGGTACCCAA GCTCCTCCAC AAAAAGCCAA AAACGCTCTA 
AGAGTTCCAA GAGCGGCAAA GGAAAGCCTA AACGCAGCAA GAGCTCAAAG AAAAGTGGGA 
AATCGTTTTA TTCAGGCGGT GGATTCTTTG TACCGTCATC ACCGCAAAGT CCAGTTCTAC 
CGGTAAACTC ACCGGTACCG GCACCACGGC ACCACCGTCA GTATCGAGCA ATCCCACCGG 
TGAGCCAACA CGTTCCATTA GCACTGAGTT TCCAACGGCG TTGCAAGAAG TGGAAGTGCC 
AACCTTCACC CCCACTGAAG CATTCCTTCC GTTTGAATCT TTAGCGGAGC TGGTGGAGGC 
CGTTGACGAA TACGTCGACG ACCGAAGCCC CGAGTCAAAC GTTGCACGCA TACGAGGATT 
TCCCATCAAT GCCTGGGACG TCAGTCAGTT ATCGGATTTT AGATTTTTGT TTAGTCCTAG 
TTCGGAACGT TCCTCTTCGT TGGGCGACTT CAACGAAGAT TTGGATCAAT GGGACATGTC 
TAACGCAGTA TCGCTTGATT CAATGTTTCT GAATGCAATG TATGTACAAT ATCGAGGAAA 
GAGATACCGT TTGCTCCGGT AGTCCTAGCC CTTTAGGACT TTTCCCGCTT CCACTGACTC 
TGTATTTGTT TTCGCCTCAT AGCGCTTTTA ACGGAGATAT TTCCACATGG GATACCCGAA 
ACGTGCAAAG CGCTACATTT CTATTTTCCG GGGCTGTATC CTTTCGTGGG GACTTGAGTT 
CATGGGACAC GTCTAGTTTT CAGAGCGCGT TTGGAATGTT TCGCGATGCG TCTGCATTTG 
ATTCTGACAT TGGTGGATGG GATGTATCGA ATGTACGTGA CATGGATGAC ATGTTTTTGA 
ATGCTGCATC TTTCAATCAA GATATTTCAT CCTGGGACGT GTCTGGCGTA GTCGACGCAG 
CGGGTTTTAC AGATACATTT GCCGGAGCAG CCTCTTTTGA TCAAAATCTA TGTGCCTGGG 
GAGATTTGAT CCAAGGTGAT AGTCGTCAGG TTGAGCGAAT GTTCATCAAC ACAGGCTGCG 
CCTCAGCGTC AGATCCTGAC CTGGAGTTTT TTCCCAAAGG CCCATTCTGC TCCTTCTGTG 
GTTGA

Protein sequence

MSSTEKEGTQ APPQKAKNAL RVPRAAKESL NAARAQRKVG NRFIQAVDSL YRHHRKPTRS 
ISTEFPTALQ EVEVPTFTPT EAFLPFESLA ELVEAVDEYV DDRSPESNVA RIRGFPINAW 
DVSQLSDFRF LFSPSSERSS SLGDFNEDLD QWDMSNAVSL DSMFLNAIAF NGDISTWDTR 
NVQSATFLFS GAVSFRGDLS SWDTSSFQSA FGMFRDASAF DSDIGGWDVS NVRDMDDMFL 
NAASFNQDIS SWDVSGVVDA AGFTDTFAGA ASFDQNLCAW GDLIQGDSRQ VERMFINTGC 
ASASDPDLEF FPKGPFCSFC G