Gene PHATRDRAFT_34011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_34011
Symbol
ID	7197796
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011672
Strand	-
Start bp	872477
End bp	873730
Gene Length	1254 bp
Protein Length	417 aa
Translation table
GC content	51%
IMG OID
Product	predicted protein
Protein accession	XP_002178594
Protein GI	219115597
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGAAAC AAATGGTAGA CCAACAACAT CGGCGGTCGC ATATGTTTGT ATTACGGTCA 
TCGATGCACT TTGTACTGAG GGCCTTTCTG GTGATATGGG CGCTCCTCTC CGCAACTACG 
ACCACTCTGC TGCACTCCCA AAATTCCTTC TCCATTCTTC CCGCGGACGT CGCTTACTAC 
ATGGCTGTGT CGGGAAATAA TTCAAATTCA CAACAGGAGG AAAGGAAGGA TGAATACAAG 
CTCCACGTGG ATAAGGCCTA TCAAAAATAC AATTTTGAAG TCGATACTCC GACAGCTCCG 
GTTTGCTATC CGCTAAGGGC TAAAGATGTC GACTTTACCC TTGTGACGCA ATTATCTGAT 
GACCGTCTCG CTATGATGCG ACCGCACTGC AAGCGCTGGG GAAAGCATAC TATTTCTCTG 
GCAATTGGAA CCAACGAGAG CCGAGACACC GTCGAGCAGG CATTGTCAAA ATCGGGTTGC 
GATACAGCTT TGATCACATT AAGTATTGTG CGCGACTTCG ATTCCGATCA AAAGTACCCT 
GTAAATAAAT TGCGGAACGT TGCCATGTCC CAGGTCAGAA CAAGCCACGC AGTCATCATC 
GACGCGGATT TCGTTCTCTC GCCGAATCTT TACGAGACCC TTCACTTACA CAATAAAACT 
CTGGCCGCTG ACTCTACGAA TGCTTTGGTG ATTCCATCGT TTGAGCTGCG GAAAGCTTGC 
CGACGACGAA ACAGGCGCTG TATCACCATG TATTCGGCCA TGGTTCCACG CAACAAGGAC 
GGGCTTTTGG AGCTGTACGA CCCGATGACG GAAGACTCTG CTGGATACGG TATCGCCCAA 
TTCGACATCA GGGGCAATTA CCACGGTCAC GCGAGTACGC GTTACGCCGA CTGGGCGAGC 
CAGCCGGCCG AGCAACTGTT GCCCATTGAG TGTGTGACCT CCGACCGGTA CGAGCCTTAC 
CTGGTCGTCC GTCATTGCCG AGACCTTCCG CCATTTCAAG AAGCCTTTGT TGGGTATGGC 
CAGAATAAAT TGACTTGGAT GCAACAAGTC CGCCGGAGGG GCTACAAGCT GTTTCAAGTG 
GGTGAAGTAT TTGCGGTTCA TCTGCCCCAC AGCAAGTCCC CGGCGTTTAA ACAGTGGCAT 
ATGGTTGGCA AAGCAAACCG TAGCTTGCTG GCCGTGACGA CAATTGCGGA CGCATTCGGA 
CTCTGGATGA ACGAAACCGT GCCAGATTTC TCACAAGTTC CGTATTGCTC ATAG

Protein sequence

MEKQMVDQQH RRSHMFVLRS SMHFVLRAFL VIWALLSATT TTLLHSQNSF SILPADVAYY 
MAVSGNNSNS QQEERKDEYK LHVDKAYQKY NFEVDTPTAP VCYPLRAKDV DFTLVTQLSD 
DRLAMMRPHC KRWGKHTISL AIGTNESRDT VEQALSKSGC DTALITLSIV RDFDSDQKYP 
VNKLRNVAMS QVRTSHAVII DADFVLSPNL YETLHLHNKT LAADSTNALV IPSFELRKAC 
RRRNRRCITM YSAMVPRNKD GLLELYDPMT EDSAGYGIAQ FDIRGNYHGH ASTRYADWAS 
QPAEQLLPIE CVTSDRYEPY LVVRHCRDLP PFQEAFVGYG QNKLTWMQQV RRRGYKLFQV 
GEVFAVHLPH SKSPAFKQWH MVGKANRSLL AVTTIADAFG LWMNETVPDF SQVPYCS