Gene PHATRDRAFT_11083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_11083
Symbol
ID	7197914
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011672
Strand	-
Start bp	1232850
End bp	1233998
Gene Length	1149 bp
Protein Length	280 aa
Translation table
GC content	52%
IMG OID
Product	predicted protein
Protein accession	XP_002178666
Protein GI	219115741
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.492894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAATG GAGTCCACGG CGTTCGGGCC CGTCGAACGG CACTCGCCGA CGCCGTATCT 
GGTGTCGCCG CCTCGTTGTT GTCGTTATGG TTGTTTTATC CAGTCGACGT ATGGAAGACG 
AACGCAGCCG CAGGAAATGC GCCCGTTGTC TGGGGGAGTA TACAAAATTG GCGTGCATTG 
TACGCTGGGT GGGCTGCAAA GTCGTTACAC ACGGCGAGTA GCTCGTTCTG TTATTTCTAT 
CTGTACAGCT GGATCCTTTC GATATGGAAA GGAAACCGCT CCAGCAACGA AATCTCCACG 
ATTGCTCGAC TATGCCTGTC GGCCGTAGCC GCCATGGCAA ATACGTTTCT GACCTTACCT 
CTTGATGTCT TATCGTCGCA ACAACAAACG GATCGCAGAC GGACCGCGTT AAGGTATACA 
CAGGATGGCC ACGAGCTTGA GCAACAGTCC AAACAGCCTC CGTCGCCTTG GAGAATGCAG 
AACGACACGC CCAGTACAGA CATGCTGATT ACAATGAGCG AACAACTGGA AACGGAAGCC 
GAAGACGGTA CCAACTTACC AGAGCGACAA CCTGGACCAA ACAATGGTTG CAAGTCCGAG 
CCAAGAAAAT ATCGCACGCA AGCGACGCGA ATACTGGAAA GCAGCCCCTC AAATATTCAG 
GAATGGGTCA CATCCAACTT TTCTCGTCAT CAACCGTTTA CTTTGAGAGA GATTCTCAGT 
TTGTGGAAAG GACTGTGGCC CTCGTTACTA CTGTGCAGTA ACCCCGCCAT CCATTTTACC 
GTGTTCGATA GCGCAAAGAC ACACTTACTG AACCAGCAGT CTCACAAGTC CAGCTTGTCC 
CTCGTCGAAG CCTTTATTCT TGGTCTACTT GCCAAGCTGG TCGCCACCAT TGCCACCTAC 
CCATTAATTC GAGCAAAAAT CATGCTCATG GTCACAAACC AATCAAACTT GTGGCCGTGC 
CTGAGAGACG AGTATGCGCA GCATGGTGTG GGAGGCCTTT ACAAGGGCTG TCGTGTGCAA 
CTTTTGCACA CGCTGCTCAA GACTGCGTTC CTCATGATGG CCCGGGAACG CATCAACCAA 
AGTACGAGTC GAATGGTGCT TCCAAACATG TCTTTCTCTG CTCGTAGTAC GGTGCCACCA 
CACCAGTAA

Protein sequence

MKNGVHGVRA RRTALADAVS GVAASLLSLW LFYPVDVWKT NAAAGNAPVV WGSIQNWRAL 
YAGWAAKSLH TASSSFCYFY LYSWILSIWK GNRSSNEIST IARLCLSAVA AMANTFLTLP 
LDVLSSQQQT DRRRTALSLW KGLWPSLLLC SNPAIHFTVF DSAKTHLLNQ QSHKSSLSLV 
EAFILGLLAK LVATIATYPL IRAKIMLMVT NQSNLWPCLR DEYAQHGVGG LYKGCRVQLL 
HTLLKTAFLM MARERINQST SRMVLPNMSF SARSTVPPHQ