Gene PHATRDRAFT_46447 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_46447
Symbol
ID	7201548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011678
Strand	+
Start bp	368238
End bp	369517
Gene Length	1280 bp
Protein Length	275 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002180813
Protein GI	219120136
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTTTACCTTA CCTCCCACCA ACGGCAAGAG ACCGAATTGG AACATTGTTC GAAGCAGCTG 
TAAAATTGTT TCATGCTGCT GACCAGTCAG AGAAATTTGA AACGTGCACT TGGCGCTATG 
TACAATGTAG TGTTCGGATC ATCATTTCAT CCCGACCTGA CTAGGCAGCA GTCTTGAACT 
CCATGAAATG AGAAAATCGA ACCGAAGTGG CCTTTTCTCT ATCAGCAACA ACGCGAAGGA 
GGCTTTTAGT TGCTCGACGT AAATATTCTC GAACACATGC ATTACATGAT AGGTTGCGCG 
ATCGCCTGCG AGAGAGGCTA CAATTGCATA GATGCGAAGA CAGGCCTATC AAGAACGGAA 
TCTGAACAAG GACAATCAAG GTCACAAAAA ACGGAAGCAC AGACGATTAC TTTGAGATTA 
TTACGAAAGC CATGAAACTA TCCTATGTTA CTTCACTACC AGCAATGACT TCGGCTTGCA 
ACACCGGGCA ATACCGGATG GGACGCTCTT GCATGAATGG TAGTAACTCC ATTCGGAATT 
GTGCTAGACG TCACCATTGC GGAGGCAATC GCCACGGCTG GGGTCATGCG TGCCGGAATG 
GGGTGGTTCA TGAGGATGCA GCGGAAAAGT TGCTTGTGTC TAGCTGGGGT CCTCGTAGTC 
TTGGTCACCA CAACTGTGCG CCGGGAATCG GACCCCATGA AGGACAGCAA GATACGAAAA 
TGTGCTTTGG GCAGGGACAC CCAGGCAGTC AAAAAGGCCA AGGCTGGAAC TTCTGGCAAT 
CTAGTTCCAC TACGCAGGGT CAAGTGCTTA GCCCGGCTCA AGGAAGAGGA CGCCGGCAGG 
GTTTAGGCAT GGGTTGGCGC TCGACGGAGG AAAGTCAGCC ATGTGAATTG AGAAACATGG 
TTGGACAGAG TTCCCATGCG CCGTTGGTTG ATATCGTTAC AGATGATGAC CATGTATTTC 
AAATAGCTTT TGACTTGCCC TATGCAAAAC CATCGGACAT TGAAATCTCT GTCAATAGAC 
AGGATAGAGT CTTGACTGTT TCGGGTATGC GTCAAATTGG ATTTGGAAGT GAAACTTCTA 
TGATCCCTTT CTTGGAGCGC ATTTCCATAG ATTCATGGAT CAGTATGGAT CGATTCTCGG 
CGAAGCTAAG CAACGGATTA TTGCTGGTTA CAGCCCCAAA AGAATTTGAT GCGAAAGACA 
GCTTTGTCCA GAAGATTTCC ATCCAGGATG TCGACACTAA AGAGCAAGCT ACGGATTAGA 
AAATGTAAGT TATAAAAACC

Protein sequence

MKLSYVTSLP AMTSACNTGQ YRMGRSCMNG SNSIRNCARR HHCGGNRHGW GHACRNGVVH 
EDAAEKLLVS SWGPRSLGHH NCAPGIGPHE GQQDTKMCFG QGHPGSQKGQ GWNFWQSSST 
TQGQVLSPAQ GRGRRQGLGM GWRSTEESQP CELRNMVGQS SHAPLVDIVT DDDHVFQIAF 
DLPYAKPSDI EISVNRQDRV LTVSGMRQIG FGSETSMIPF LERISIDSWI SMDRFSAKLS 
NGLLLVTAPK EFDAKDSFVQ KISIQDVDTK EQATD